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„One of the most important “facts” about the labor market is 
that individuals with more education earn higher wages. ... 
Despite this evidence most economists are reluctant to 
interpret the earnings gap between more and less educated 
workers as an estimate of the causal effect of schooling. 
Education is not randomly assigned across the population; 
rather individuals make their own schooling choices.” 


David Card (1995) 


1. Problemstellung und Gang der Untersuchung 


Seit Beginn der 90er Jahre steht das Thema Bildung in Deutschland verstärkt im 
Blickpunkt der Offentlichkeit. Themen wie Lebenslanges Lernen, Lehrer- 
mangel, die Einführung von Studiengebühren, die Reform des BAföG und Maß- 
nahmen zur Reduzierung der Studiendauer, um nur eine kleine Auswahl zu nen- 
nen, stehen regelmäßig in der öffentlichen Diskussion. Dies darf nicht verwun- 
dern, hängen doch im Zeitalter der Globalisierung die Entwicklung eines Lan- 
des, seine technologische Leistungs- und seine Wettbewerbsfähigkeit in hohem 
Maße von dem Faktor Humankapital ab. 


„Bildung und Fortschritt ergänzen sich in hohem Maße und 
bilden die Grundbausteine von Prosperität und Wettbe- 
werbsfähigkeit im Zeitalter der Automatisierung“ 


Seit den 60er Jahren nimmt der Anteil der Hochqualifizierten an allen Erwerbs- 
tätigen in den OECD-Ländern beständig zu.” Zahlreiche Studien zum 
Zusammenhang zwischen der Entwicklung des Bildungsniveaus und dem Wirt- 
schaftswachstum eines Landes wurden angefertigt, die jedoch den theoretisch 
abgeleiteten positiven Einfluss des Humankapitals nicht in dem Maße empirisch 
belegen konnten, wie allgemein erwartet worden ist’. Dennoch zeigen sowohl 
die durch zahlreiche international vergleichende Studien ausgelöste Diskussion 
um die Zukunft der Bildungssystems als auch der vielerorts beklagte Akademi- 
kermangel in Deutschland die Befürchtungen einer Verschlechterung der relati- 
ven Position des eigenen Bildungssystems im internationalen Vergleich. 


" Pfeiffer/Falk (1999), S. 5. 

? Vgl. beispielsweise de la Fuente/Donénech (2000), S. 49ff. 

Als mögliche Ursache dafür werden häufig die speziell mit der Definition und Messung 
von Humankapital und technischem Fortschritt verbundenen Probleme genannt. Vgl. de la 
Fuente/Donenech (2000), S. 20ff. 
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Die Ergebnisse des deutschen Bildungssystems werden nun nicht nur dank der 
PISA-Studie* der OECD in der aktuellen bildungs- und arbeitsmarktpolitischen 
Diskussion zunehmend kritisch betrachtet. Schon die TIMSS-Studie” der OECD 
bescheinigte deutschen Schülern im Vergleich zu anderen OECD-Ländern 
schwache Leistungen in Mathematik und den Naturwissenschaften. 


Im scheinbaren Widerspruch hierzu entnimmt man den Zahlen der OECD, dass 
der Anstieg der Reallöhne in Westdeutschland um 9,9 Prozent von 1989 auf 
1994 und um 21 Prozent von 1985 auf 1994 von nur sehr wenigen OECD-Län- 
dern erreicht wurde.° Geht man davon aus, dass hohes Wachstum der Reallöhne 
über einen so langen Zeitraum nur durch eine entsprechend hohe Produktivität 
möglich wird und diese wiederum ein entsprechend hohes Qualifikationsniveau 
der Beschäftigten voraussetzt, legt dies die Folgerung nahe, dass es um das deut- 
sche Bildungssystem doch nicht so schlecht bestellt sein kann. Bekräftigt wird 
dies durch das Ergebnis des PURE-Projektes, dass die Rendite eines zusätz- 
lichen Schuljahres in Deutschland mit durchschnittlich etwa 8 Prozent im inter- 
nationalen Vergleich mit an der Spitze steht.’ 


Ein der wissenschaftlichen Diskussion vorbehaltenes Problem ist jedoch, wie 
diese Rendite eines zusätzlichen Schuljahres gemessen wird und welche Prob- 
leme damit verbunden sind. In Teil I der Arbeit wird diese Problematik aufge- 
griffen und der Zusammenhang zwischen Bildung und Löhnen in der Humanka- 
pitaltheorie beschrieben. Durch die Arbeiten von Jacob Mincer (1958 und 1974), 
Theodore Schultz (1960) und Gary Becker (1962), hat sich ein Standardansatz 
zur Schätzung von Bildungsrenditen herauskristallisiert, der den meisten empiri- 
schen Anwendungen auf diesem Gebiet zugrunde liegt. Kapitel 2 stellt zunächst 
kurz die Erfolgsgeschichte dieses Ansatzes dar und geht auf die wichtigsten mit 
ihm verbundenen Probleme ein. Darauf aufbauend wird in gebotener Kürze ein 
Überblick über ökonomische und ökonometrische Modellerweiterungen gege- 
ben. Trotz all dieser Erweiterungen liefern sämtliche auf diesen traditionellen 
Modellen basierende Schätzungen lediglich eine durchschnittliche Bildungsren- 


* Vgl. Baumert et al. (2001). 

Vgl. zu einer Kritik an der TIMSS-Studie, insbesondere auch zur Konsistenz der 

Ergebnisse von TIMSS/I-TIMSS/III, Baumert et al. (2000). 

6 Vgl. OECD (1997), S. 7. Die Wachstumsraten wurden für Bruttomonatslöhne 
vollzeiterwerbstätiger Männer unter Berücksichtigung jährlicher Sonderzahlungen mit den 
auch in der vorliegenden Arbeit verwendeten Daten des Sozio-oekonomischen Panels 
(SOEP) ermittelt. 

7 Vgl. Harmon et al. (2001), S. 9. 
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dite, unabhängig davon, ob man Investitionen in 9 bzw. 10 Bildungsjahre oder 
in 12 bzw. 13 Bildungsjahre miteinander vergleicht. Daran ändert auch die Ver- 
wendung von Quantilregressionen nichts, die erstmals in Arbeiten von Powell 
(1984 und 1986), Chamberlain (1994) und Buchinsky (1994) zur Schätzung von 
Bildungsrenditen eingesetzt wurden. Die Darstellung dieser gebräuchlichsten 
traditionellen Verfahren zur parametrischen und semiparametrischen Schätzung 
der Bildungsrenditen in Kapitel 2 ist nötig, um die in Kapitel 3, dem zentralen 
theoretischen Teil der Arbeit, beschriebenen nichtparametrischen Verfahren zur 
Schätzung von Obergrenzen der Bildungsrenditen im Vergleich zu den bisheri- 
gen empirischen Arbeiten besser einordnen zu können. 


Die vorliegende Arbeit übt in diesem dritten Kapitel in Abschnitt 3.1 Kritik an 
verschiedenen Annahmen des Standardmodells und seiner Erweiterungen. Diese 
Kritik wird im Rahmen einer umfangreichen Diskussion und Darstellung des 
Identifikationsproblems bei der Schätzung von so genannten Treatmenteffekten 
geführt. Bildung wird im Rahmen dieser Schätzungen als Treatment aufgefasst 
und es werden in Abschnitt 3.2 verschiedenste alternative Annahmen eingeführt, 
die ökonomisch wesentlich plausibler erscheinen und in ihrer ökonometrischen 
Umsetzung zu Vorteilen gegenüber den traditionellen Schätzungen führen. Al- 
lerdings bedingen alle diese Annahmen, dass lediglich die nichtparametrische 
Schätzung einer Unter- bzw. einer Obergrenze der Bildungsrenditen möglich ist. 
Diese nichtparametrische Schätzung von Grenzen wurde bisher nur vereinzelt, 
z.B. in Ginther (2000) und Manski/Pepper (2000), und auch dort nicht systema- 
tisch auf die Schätzung von Obergrenzen für Bildungsrenditen angewendet. Sie 
werden deshalb in der vorliegendenden Arbeit in dieser Breite erstmals ausführ- 
lich theoretisch dargestellt, diskutiert und empirisch evaluiert. Als zentrales Er- 
gebnis dieses dritten Kapitels zur Schätzung der Obergrenzen von Bildungsren- 
diten kann festgehalten werden, dass sich bei Annahme monotoner Selektion in 
Bildungsniveaus und gleichzeitiger Annahme monotoner Lohnfunktionen, 
MTS-MTR genannt, die niedrigst möglichen Obergrenzen ergeben. Für Instru- 
mentenschätzungen werden nichtparametrische Obergrenzen dargestellt, die an- 
stelle der üblichen Annahme der Unabhängigkeit im Mittelwert (Mean-Indepen- 
dence) lediglich Monotonie im Mittelwert (Mean-Monotonicity) voraussetzen. 
Abschnitt 3.3 beschäftigt sich mit der Bedeutung von Fehlern in den Datensät- 
zen. Zwei Fehlermodelle werden verwendet, um zu untersuchen, inwieweit die 
Identifikation von Wahrscheinlichkeiten, Mittelwerten und Quantilen dadurch 
beeinflusst wird. Es wird gezeigt, dass trotz Datenfehlern in Analogie zur Be- 


® Von der inzwischen kaum noch verwendeten „Reverse Regression“ einmal abgesehen. 
Vgl. Greene (1984). 
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stimmung von Grenzen fiir Treatmenteffekte Grenzen fiir diese Parameter ange- 
geben werden können. Dies wird anhand von Daten des Sozio-oekonomischen 
Panels (SOEP)? am Beispiel der Angaben zum Haushaltsnettoeinkommen des 
Jahres 1999 erstmals für Deutschland durchgeführt und mit Daten des Current 
Population Surveys (CPS) fiir die USA verglichen. Dabei werden fiir beide Fall- 
beispiele erstmals auch Bootstrap-Konfidenzintervalle fiir die geschätzten Gren- 
zen ermittelt. Kapitel 3 schließt mit einem Vorschlag zur Anwendung nichtpa- 
rametrisch geschätzter Obergrenzen für die Messung der Lohndiskriminierung. 


Der empirische Teil II beginnt in Kapitel 4 im ersten Abschnitt mit einem Über- 
blick über ausgewählte Studien zur Entwicklung der Bildungsrenditen im inter- 
nationalen Vergleich. Der Studie von Psacharopoulos (1994) werden zwei mak- 
roökonomische und zwei mikroökonomische stilisierte Fakten der Bildungsfor- 
schung entnommen. Die bei Psacharopoulos aufgeführten makroökonomischen 
Fakten zum negativen Zusammenhang zwischen dem Pro-Kopf-Einkommen 
und der durchschnittlichen Bildungsrendite eines Landes und dem negativen Zu- 
sammenhang des durchschnittlichen Bildungsniveaus und der durchschnittlichen 
Bildungsrendite eines Landes werden in Abschnitt 4.2 anhand von Sekundarlite- 
ratur überprüft. Es wird sich zeigen, dass hauptsächlich aufgrund von Defini- 
tions- und Messproblemen die Ergebnisse der empirischen Studien zu beiden 
Zusammenhängen sehr uneinheitlich ausfallen und von stilisierten Fakten 
eigentlich keine Rede sein kann. 


Nach der Beschreibung der Datenbasis und der Stichprobenselektion in Ab- 
schnitt 5.1 wird in Abschnitt 5.2 die Entwicklung der Lohnstruktur in Deutsch- 
land von 1984 bis 2000 anhand der Entwicklung der durchschnittlichen realen 
Bruttostundenlöhne und ausgewählter Quantile sowie Quantilsdifferenzen, 
differenziert nach Geschlecht, Kohorten und Bildungsjahren, untersucht. Es 
zeigt sich, dass die Lohnverteilung der Männer, unabhängig von der Differen- 
zierung nach Kohorten oder Bildungsjahren deutlich stärker gespreizt ist als die 
der Frauen. Während die Spreizung bei den Männern, gemessen durch verschie- 
dene Quantilsdifferenzen, im unteren Bereich der Lohnverteilung mit jahres- 
durchschnittlich 2,5-3 Prozent im Vergleich zu den Frauen mit etwa 0,7 Prozent 
und zum oberen Bereich mit rund 1,4 Prozent deutlich stärker zugenommen hat, 
vergrößerte sich die Spreizung bei den Frauen gerade im oberen Bereich um 
circa zwei Prozent. Als weiterer signifikanter Unterschied der Lohnstrukturen ist 
festzuhalten, dass sich die Verteilung der realen Bruttostundenlöhne der Frauen 


? Der Autor dankt dem Deutschen Institut für Wirtschaftsforschung (DIW) für die 
Bereitstellung der Daten. 
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wesentlich symmetrischer darstellt als die der Manner. In Abschnitt 5.3 werden 
die in Kapitel 3 eingeführten Annahmen zur Schätzung der Obergrenzen syste- 
matisch untereinander und mit OLS-Schätzungen verglichen. Es wird sich zei- 
gen, dass man lediglich mit der bereits erwähnten Annahme von MTS-MTR 
durchweg ökonomisch sinnvolle Obergrenzen für die Bildungsrenditen erhält. In 
Abschnitt 5.4 werden die beiden mikroökonomischen stilisierten Fakten, einer- 
seits die Tendenz zu im Zeitablauf sinkenden Bildungsrenditen und andererseits 
die für Frauen im Vergleich zu Männern höheren Renditen erstmals für 
Deutschland über die Periode 1984 bis 2000 mit Daten des SOEP anhand Ober- 
grenzen bei Annahme von MTS-MTR evaluiert. Zum Vergleich werden dabei 
die entsprechenden Schätzergebnisse der traditionellen Verfahren herangezogen. 


Ebenso wie die beiden makroökonomischen Thesen müssen auch die beiden 
mikroökonomischen stilisierten Fakten verworfen bzw. zumindest differenzier- 
ter betrachtet werden. Während sich in Deutschland bis zum Jahr 1997 ein 
leichter, aber nicht signifikanter Trend zu sinkenden Bildungsrenditen bei den 
Männern und ein deutlicherer Abwärtstrend bei den Frauen feststellen ließ, stie- 
gen die Renditen bei Männern und Frauen von 1998 auf 2000 jeweils um knapp 
einen Prozentpunkt. Ob dies eine Trendwende darstellt, muss die Entwicklung 
der nächsten Jahre zeigen. Für vollzeiterwerbstätige Frauen ergeben die Schät- 
zungen nur vereinzelt höhere, zwischen 1988 und 1993 dagegen um einen hal- 
ben Prozentpunkt niedrigere Bildungsrenditen. Zusätzlich zu diesen beiden, in 
Anlehnung an Psacharopoulos durchgeführten Untersuchungen, wird eine 
Kohortenanalyse durchgeführt, um zu testen, ob die Bildungsrenditen jüngerer 
Kohorten, insbesondere bei den Frauen, im Zeitablauf gesunken sind. Die hierzu 
durchgeführten Schätzungen ergeben für die jüngste Kohorte der Frauen ein- 
deutig gesunkene Bildungsrenditen. Abschließend wird der im theoretischen 
Teil entwickelte Vorschlag der Anwendung nichtparametrischer Obergrenzen 
zur Messung der Lohndiskriminierung einem empirischen Test unterzogen. Die 
Ergebnisse hierzu sprechen allerdings eindeutig für das traditionelle Verfahren 
nach Oaxaca/Blinder. 


Letztlich bekräftigen die Erkenntnisse, die durch die nichtparametrische Schät- 
zung von Obergrenzen der Bildungsrenditen gewonnen wurden, aus einer neuen 
Blickrichtung, dass es sehr fragwürdig ist, sich bei der Analyse der Lohnstruktur 
und ihrer Entwicklung auf eine einzige Kenngröße, die durchschnittliche 
Bildungsrendite, zu konzentrieren. Einige Schlussbemerkungen hierzu sowie ein 
Ausblick auf angrenzenden Forschungsbedarf beschließen die Arbeit in Kapitel 
6. 
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7 
Teil I: Bildung und Léhne in der Humankapitaltheorie 


Die Humankapitaltheorie geht wie bereits erwähnt zurück auf die Arbeiten von 
Mincer (1958), Schultz (1960) und Becker (1962). Ziel der Humankapitaltheorie 
ist es zu erklären, warum und wieviel Zeit und Sachgüter Individuen in Ab- 
hängigkeit von ihren Fähigkeiten und Präferenzen in Bildung und somit ihr 
Humankapital investieren. Unter Humankapital versteht man dabei — in weit- 
gehender Analogie zum Sachkapital — den akkumulierten Bestand an Wissen 
und Fertigkeiten eines Individuums, Kapital, das ebenso wie Sachkapital bei- 
spielsweise durch Vergessen teilweise abgeschrieben werden muss. Neben die- 
ser Analyse des individuellen Entscheidungskalküls finden sich humankapital- 
theoretische Überlegungen auch im Bereich der personellen Einkommensver- 
teilung” und der älteren und neueren Wachstumstheorie. Während in der älteren 
Wachstumstheorie die gesamtwirtschaftliche Produktion als Funktion der beiden 
Inputfaktoren Arbeit und Kapital modelliert wurde, steht in der neueren 
Wachstumstheorie zunehmend die Humankapitalbildung im Vordergrund. 
Humankapital wird als entscheidender Input für den Forschungs- und Entwick- 
lungssektor betrachtet, durch den technischer Fortschritt in Form neuer Güter 
und Prozesse endogenisiert wird.'' Die vorliegende Arbeit beschäftigt sich 
intensiv mit der Problematik der Schätzung von Bildungsrenditen unterschied- 
licher Bildungsinvestitionen anhand von Mikrodatensätzen, so dass die Proble- 
matik des makroökonomischen Zusammenhangs von Bildung und Ein- 
kommensverteilung gänzlich ausgeklammert wird. Der Einfluss der Bildung auf 
das Wachstum oder das Pro-Kopf-Einkommen wird in Kapitel 4 anhand von 
Sekundärliteratur in die Diskussion einbezogen. 


2. Traditionelle Ansätze zur Messung von Bildungsrenditen 


In Kapitel 2 sollen in der gebotenen Kürze die für den theoretischen und empi- 
rischen Teil der Arbeit wichtigsten ökonomischen und ökonometrischen 
Aspekte der Humankapitaltheorie dargestellt werden. In Abschnitt 2.1 wird kurz 
geschildert, warum sich ein im Vergleich zu anderen mikroökonometrischen 
Ansätzen sehr einfacher Ansatz trotz verschiedenster Weiterentwicklungen nun 
schon fast 30 Jahre in der empirischen Forschung behaupten konnte. Abschnitt 
2.2 gibt dann einen Überblick über die wichtigsten traditionellen Ansätze zur 
Messung von Bildungsrenditen. 


0 Vgl. etwa Ramser (1987). 
'' Vgl. Lucas (1988) und Romer (1990). 
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2.1 Die Erfolgsgeschichte der Mincer’schen Lohnfunktion 


Nachdem die Arbeiten von Mincer (1958) und Becker (1962) noch tiberwiegend 
den Zusammenhang zwischen Investitionen in das Humankapital und der per- 
sonellen Einkommensverteilung behandelt haben, entwickelte Mincer (1974) 
das theoretische Fundament der Einkommensfunktion’* und deren Umsetzung in 
die folgende ökonometrisch schätzbare Gleichung!” 


(2.1) Iny, =B, + Bs, +B3ex, +Byex? +e, tele: 


Der semi-logarithmische Ansatz ergibt sich dabei aus der theoretischen Ablei- 
tung dieser Gleichung bei Annahme einer im Lebenszyklus konstanten Ertrags- 
rate der Bildungsinvestitionen und eines im Erwerbsverlauf abnehmenden An- 
teils an Investitionen in weiteres Humankapital. y, steht für das Einkommen, s, 


für die Anzahl an Bildungsjahren, ex, für die potenzielle Berufserfahrung, ex? 
für die quadrierte potenzielle Berufserfahrung des t-ten Individuums und e, für 


den üblichen Störterm, der alle sonstigen Faktoren enthält, die Löhne beein- 
flussen und die nicht bereits durch die Bildungs- und Berufserfahrungsvariable 
erfasst sind. Als Einkommens- bzw. als Lohnvariable wird normalerweise ent- 
weder der Bruttostundenlohn oder der Bruttomonatslohn verwendet.'* Die 
tatsächliche Anzahl an Bildungsjahren, die den Bestand an formal erworbenem 
Humankapital messen soll, steht in der Regel nicht direkt zur Verfügung. Die 
Variable „Anzahl an Bildungsjahren“ wird daher in der Regel über die Infor- 
mation zum höchsten erworbenen Bildungsabschluss durch Standardaus- 
bildungszeiten generiert. Durch den semi-logarithmischen Ansatz kann der 
Koeffizient ß, direkt als Rendite eines zusätzlichen Schuljahres interpretiert 
werden. Exakt ist die Rendite r eines zusätzlichen Bildungsjahres durch den 
semi-logarithmischen Ansatz gegeben als r = (exp(ß,)-1)-100. Für betrags- 


mäßig kleine Werte des Koeffizientens ß,, etwa |B,|< 0,1, entspricht dies ziem- 


lich genau dem Wert des Koeffizienten. Ebenso wie die tatsächliche Bildungs- 
zeit ist auch die tatsächliche Berufserfahrung in der Regel nicht direkt als Vari- 
able verfügbar. Da ihre Verwendung zu Endogenitätsproblemen führt, wird die 
tatsächliche, selbst wenn sie ermittelt werden könnte, in der Regel durch die 
potenzielle Berufserfahrung ersetzt. Diese ist als Alter minus Anzahl an 


12 Auch Lohnfunktion oder Verdienstfunktion genannt. Vgl. Franz (1999), S. 92. 
3 Zur Herleitung der Einkommensfunktion vergleiche man beispielsweise Franz (1999), S. 
90-92. 
'4 Je nach Datensatz bereichert um Informationen zu Überstunden, Sondervergütungen usw. . 
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Bildungsjahren minus Schulanfangsalter (meistens wird hierfür 6 Jahre ange- 
setzt) definiert.'” Der quadratische Term der potenziellen Berufserfahrung ergibt 
sich aus der theoretischen Ableitung der Schätzgleichung, da mit zunehmender 
Berufserfahrung die Restarbeitszeit eines Individuums sinkt, dieses wie bereits 
erwähnt immer weniger in Bildung investiert und der Lohn daher nur mit ab- 
nehmender Rate steigt. Für diese Regressionskoeffizienten ist daher B, — 0 und 


B, <0 zu erwarten. 


Diese Standardversion der Einkommensfunktion liegt seit nun fast 30 Jahren 
unzähligen empirischen Untersuchungen zugrunde und bildet — wie in Kapitel 4 
geschildert wird — den Ausgangspunkt der Renditeschätzungen in einem euro- 
paweiten Projekt, der eingangs erwähnten PURE-Studie. Willis (1986) bezeich- 
nete diese nach Jacob Mincer benannte Mincer’sche Lohnfunktion dann auch als 


„= one of the great success stories of modern labor 
economics.“ 


Dabei war die Mincer’sche Lohnfunktion schon von Anfang an keineswegs un- 
umstritten. Griliches stellte bereits 1977 eine Liste von sieben kritischen Fragen 
zu dieser Standardeinkommensfunktion auf, unter anderem zur sinnvollen Inter- 
pretation dieser Gleichung und des Regressionskoeffizienten der Bildungsvari- 
ablen.'’ Inzwischen ist man sich zumindest in Bezug auf diese beiden Fragen 
weitestgehend einig. Die gängige Interpretation sei kurz geschildert. Der Erwerb 
von formaler Bildung wird als Investition betrachtet, die Kosten in Form von 
entgangenen Einkommen und direkten Kosten der Ausbildung verursacht, später 
aber zu einer höheren Produktivität und folglich zu höheren Löhnen führt, so 
dass die entstandenen Kosten zumindest amortisiert werden. Dabei wird unter- 
stellt, dass Individuen gemäß ihrer Produktivität entlohnt werden. 


Eine alternative Interpretation der Bildungsinvestitionen besteht darin, dass 
diese nicht der Produktivitätserhöhung dienen, sondern von den Unternehmen 
überwiegend als Indikator zur Auslese von Arbeitskräften verwendet werden." 
Hierbei wird unterstellt, dass erfolgte Bildungsabschlüsse lediglich eine bereits 
vorhandene Produktivität signalisieren, die Unternehmen ansonsten nicht beo- 


 Sensitivitätsanalysen mit unterschiedlichen Definitionen der Berufserfahrung haben 
gezeigt, dass die Schätzungen des Koeffizienten der Bildungsvariablen davon kaum 
beeinflusst werden. Vgl. Lauer/Steiner (2000), S. 13, und Harmon et al. (2001), S. 11. 

1% Willis (1986), S. 526. 

17 Vgl. Griliches (1977), S. 4. 

18 Vgl. Weiss (1995) und Spence (1973). 
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bachten könnten. Deswegen werden diese Modelle oft auch als Screening- und 
Signaling-Modelle bezeichnet. 


Da Humankapital eine multidimensionale Größe ist, war es naheliegend, die 
Standardlohnfunktion ökonomisch weiterzuentwickeln. Als Beispiel sei die Un- 
terscheidung von allgemeinem, zwischen Sektoren, Firmen und Berufen trans- 
ferierbarem und spezifischem, nicht transferierbarem Humankapital genannt. 


Neben der Vielfalt an Interpretations- und Erweiterungsmöglichkeiten besteht 
ein wesentlicher Grund für den Erfolg der Standardlohnfunktion darin, dass man 
durch die Schätzung z.B. mit der OLS-Regression genau eine Bildungsrendite 
erhält, deren Entwicklung im Zeitablauf gegebenenfalls sehr einfach illustriert 
und z.B. mit der Entwicklung in anderen Ländern verglichen werden kann. Dazu 
kommt, dass die Schätzgleichung (2.1) je nach verwendetem Datensatz relativ 
einfach um zusätzliche exogene und/oder endogene Variablen erweitert werden 
kann. Des Weiteren spielen diese Lohnfunktionen zum Beispiel auch bei der 
Messung der Lohndiskriminierung von Frauen’? und der Schätzung von Arbeits- 
angebotsfunktionen” eine große Rolle, ein Bereich dem unter anderem bei 
Steuersimulationen eine zunehmende Bedeutung beigemessen wird. 


Bevor in Kapitel 3 dieser Standardansatz in mehrfacher Hinsicht kritisiert wird 
und mehrere Annahmen vorgestellt werden, die zur Messung der Bildungs- 
renditen beispielsweise auf die Linearität der Lohnfunktion verzichten, stellt 
Abschnitt 2.2 zunächst die wichtigsten und gebräuchlichsten Verfahren zur 
Schätzung der Bildungsrenditen dar. 


2.2 Ein kurzer Überblick über die wichtigsten traditionellen Verfahren zur 
Schätzung von Bildungsrenditen 


Im vorigen Abschnitt wurde der Standardansatz zur Schätzung der Bildungs- 
renditen beschrieben als 


(2.1) Iny, =B, +B.s, + Bzex,; + Byex? +e, t=1,...n + 


Die Standardschätzung dieser Lohnfunktion erfolgt mittels OLS-Regression. Es 
wird angenommen, dass die erklärenden Variablen als exogen betrachtet werden 


1? Vgl. Oaxaca (1973) und Blinder (1973). 
2 Vgl. Wagenhals (2000). 
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können. Meistens werden auch noch normalverteilte Störterme angenommen. 
Die Lohnfunktion wird bei der Standardschätzung getrennt nach Geschlecht und 
nach Jahren geschätzt, um zeitliche Änderungen der geschlechtsspezifischen 
Bildungsrenditen und Änderungen der Bildungsrenditen im Zeitablauf berück- 
sichtigen zu können. 


Da die Standard-OLS-Schätzung lediglich die Schätzung der durchschnittlichen 
Bildungsrendite erlaubt, stellt das Verfahren der Quantilregression?! eine sinn- 
volle Ergänzung dar. Durch Quantilregressionen können anstelle von bedingten 
Mittelwerten bedingte Quantile der Lohnverteilung und damit Bildungsrenditen 
für unterschiedliche Bereiche der Lohnverteilung geschätzt werden. 


Unabhängig davon, ob die Gleichung (2.1) mit OLS oder Quantilregressionen 
geschätzt wird, stellt sich die Frage, ob mit der Bildungsvariable und der poten- 
ziellen Berufserfahrung bereits alle relevanten Einflussgrößen berücksichtigt 
werden. Schon bald nach der Einführung der Lohnfunktion durch Mincer wurde 
daher Kritik an dieser Spezifikation geübt. Es wurde z.B. argumentiert, dass die 
mit OLS” geschätzte Gleichung (2.1) die wahre Bildungsrendite systematisch 
überschätzt, da sie keine Variable enthält, mit der die Begabung eines Indivi- 
duums gemessen wird. 


(2.2) Iny, =B, +ß,s, + Bex, +B ex? +Bsb, +e, t=1,...,n . 


Nimmt man an, dass die Begabung, gemessen mit b, positiv mit den Löhnen 
und der verwendeten Bildungsvariable korreliert ist sowie die einzige ausge- 
lassene Variable darstellt, folgt daraus unmittelbar die Überschätzung des wah- 
ren Einflusses der Rendite eines zusätzlichen Schuljahres.” In unzähligen Stu- 
dien wurden z.B. die Ergebnisse von IQ-Tests aufgenommen, um für die Bega- 
bung zu kontrollieren. Je nach verwendeter Variable und Spezifikation sank die 
Bildungsrendite mehr oder weniger stark. In einer von Denny/Harmon (2001) 
für das PURE-Projekt durchgeführten Studie für Irland sank die Bildungsrendite 
bei Verwendung von Testergebnissen zur Lese- und Schreibfähigkeit beispiels- 
weise von 8,2 auf 7 Prozent.” Da in den wenigsten international vergleichbaren 
Paneldatensätzen eine Variable enthalten ist, die für die Begabung eines Indivi- 


71 Vgl. Koenker/Bassett (1978). 
2 Vor den 80er Jahren wurde die Quantilregression vor allem aus rechentechnischen 
Gründen noch nicht zur Schätzung von Bildungsrenditen verwendet. 
3 Vgl. Griliches (1977), S. 4. 
%4 Vgl. Denny/Harmon (2001), S. 154. 
Steffen Wirth - 978-3-631-75476-4 
Downloaded from PubFactory at 01/11/2019 04:32:44AM 
via free access 


12 


duums in die Schätzgleichung aufgenommen werden könnte, muss des Öfteren 
auf die Verwendung eines solchen Maßes verzichtet werden. Auf die Unter- 
suchung der zeitlichen Entwicklung der Bildungsrenditen hat dies jedoch inso- 
weit keinen Einfluss, als angenommen werden kann, dass diese Verzerrung im 
Zeitablauf konstant bleibt. Geht man weiter davon aus, dass die Verzerrung im 
internationalen Vergleich ungefähr gleich ist, wird auch der Vergleich der 
Bildungsrenditen zwischen den Ländern hierdurch nicht beeinträchtigt. Auf- 
grund der hohen Korrelation zwischen der Bildung der Eltern und der Bildung 
der Kinder werden anstelle eines Maßes für die Begabung zunehmend Variablen 
für den familiären Hintergrund berücksichtigt und als Instrument verwendet, um 
im Rahmen einer Instrumentalvariablenschätzung die Exogenität der Bildungs- 
variablen testen zu können. Oft werden dafür die Anzahl der Bildungsjahre des 
Vaters und oder der Mutter verwendet. Dabei wird unterstellt, dass diese 
Instrumenten mit den Bildungsvariablen korreliert, gleichzeitig jedoch mit den 
Löhnen unkorreliert sind. Untersuchungen, die für die Endogenität der 
Bildungsvariablen kontrollieren, kommen je nach verwendetem Instrument im 
Vergleich zu OLS teilweise zu dramatisch höheren (bis zu 100%) Bildungs- 
renditen, teilweise jedoch auch wie beispielsweise die Studie von Lauer/Steiner 
(2000) zu insignifikant höheren und manchmal sogar niedrigeren Bildungsren- 
diten.” Eine fundierte Diskussion des Endogenitätsproblems sowie ein Über- 
blick über die wichtigsten IV-Schätzungen findet sich z.B. in Card (2001). 


Diese teilweise drastisch höheren Bildungsrenditen bei IV-Schätzungen stehen 
nun in scheinbarem Widerspruch zu der eingangs festgestellten Überschätzung 
der wahren kausalen Rendite eines zusätzlichen Bildungsjahres aufgrund der 
Nichtberücksichtigung der Begabung. Griliches (1977) und Angrist/Krueger 
(1991) erklären dies damit, dass die Überschätzung der Renditen durch das 
Fehlen einer Variablen für Begabung sehr gering ausfalle und die große Diffe- 
renz zwischen IV- und OLS-Schätzungen eher die Unterschätzung der Renditen 
durch OLS-Regressionen aufgrund von Messfehlern bezüglich der Bildungsva- 
riablen widerspiegle. Card (2001) führt als einen gewichtigen Grund an, dass die 
Differenz zwischen OLS- und IV-Schätzungen in der Heterogenität der Ren- 
diten begründet ist.” Die hohen Renditen bei IV-Schätzungen resultierten dem- 


"7 Bound et al. (1995) raten daher zur Vorsicht beim Gebrauch von IV-Schätzern, da der 
Gebrauch eines Instrumentes zu großen Inkonsistenzen führen kann, falls die Korrelation 
zwischen dem Instrument und der Bildungsvariablen niedrig ist. 

7% Griliches zeigte schon 1977, dass die Berücksichtigung der Begabung bei der Ableitung 
des semi-logarithmischen Ansatzes dazu führt, dass begabtere Individuen modellbedingt 
über eine höhere Bildungsrendite verfügen müssten als unbegabte. Card (2001), S. 1156, 
führt als weiteren Grund die Tendenz zur Spezifikationssuche an. Darunter ist zu 
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nach aus der Verwendung von Instrumenten, die jedoch nur fiir eine Unter- 
gruppe der Stichprobe relevant sind, die im Vergleich zum Rest der Stichprobe 
hohe Renditen aufweisen. Als illustratives Beispiel fiihrt er die Schulpflicht an. 
Die Schulpflicht fiir sich allein genommen beeinflusst vermutlich vor allem die 
Bildung der Individuen, die ansonsten ein niedrigeres Bildungsniveau wählen 
würden. Wählen nun diese Individuen ohne Schulpflicht dieses niedrigere 
Bildungsniveau beispielsweise aufgrund höherer Schulkosten und nicht weil sie 
im Vergleich zu den anderen niedrige Bildungsrenditen haben, wird das Instru- 
ment Schulpflicht zu höheren Schätzungen für die Bildungsrendite führen als die 
OLS-Regressionen.”’ Diese plausible und für viele Studien, die hohe Bildungs- 
renditen bei IV-Schätzungen erhalten, zutreffende Interpretation scheint in- 
zwischen in Verbindung mit so genannten LATE-Schätzern (Local Average 
Treatment Effect) vermehrt Anhänger zu gewinnen.” 


Ein weiteres Forschungsgebiet betrifft die Berücksichtigung der Stichproben- 
selektion von Frauen. Aufgrund der im Vergleich zu Männern geringen und im 
Zeitablauf stark gestiegenen Erwerbsbeteiligung von Frauen kann nicht davon 
ausgegangen werden, dass die Stichprobe der Frauen, für die Löhne beobachtet 
werden, repräsentativ ist. Dies kann z.B. mittels der zweistufigen 
Heckman’schen Selektionskorrektur berücksichtigt werden. Dabei wird in der 
ersten Stufe mit einem geordneten Probit-Modell eine Selektionsgleichung ge- 
schätzt. Dabei wird der Erwerbsstatus einer Person erklärt und jeweils ein 
Selektionskorrekturterm geschätzt, z.B. für Teilzeit- und Vollzeiterwerbstätig- 
keit. Diese Terme werden auf der zweiten Stufe als Regressoren in die OLS- 
Schätzung der Lohnfunktion aufgenommen.” Obwohl diese Korrekturterme 
häufig signifikant sind, ist die Veränderung der Bildungsrendite größenord- 
nungsmäßig selten bedeutend.” 


Aufgrund der in den letzten Jahren stark gestiegenen Zahl von Paneldatensätzen 
bieten sich natürlich auch Random-Effects- und Fixed-Effects-Schätzer sowie 
dynamische Paneldatenschätzer zur Schätzung von Lohnfunktionen an. 
Hausman-Tests kommen fast durchgehend zu dem Ergebnis, dass Fixed-Effects- 
Schätzer verwendet werden sollten. Diese und auch dynamische Paneldaten- 
schätzer haben jedoch den Nachteil, dass aufgrund der Zeitinvarianz der 


verstehen, dass Forscher beim Vergleich alternativer IV-Spezifikationen diejenigen 
bevorzugen, die einen günstigeren t-Wert für die Bildungsrendite liefern. 

27 Vgl. Card (2001), S. 1156. 

?8 Vgl. Becker/Siebern-Thomas (2001) und Ichino/Winter-Ebmer (1999). 

” Vgl. Puhani (2000). 

°° Vgl. Lauer/Steiner (2001), S.123. 
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Bildungsvariablen diese durch die Differenzierung herausfallt und gerade die 
Bildungsrendite nicht geschätzt werden kann.”’ 


Nachdem nun die wichtigsten traditionellen Ansätze zur Schätzung der Lohn- 
funktionen kurz dargestellt wurden, wird im nächsten Kapitel, aufbauend auf 
einer Darstellung des Identifikationsproblems bei der Schätzung von Treat- 
menteffekten, Kritik an diesen traditionellen Verfahren geübt. Es werden alter- 
native und weniger restriktive Annahmen eingeführt, die unter anderem die 
Schätzung nichtparametrischer Grenzen von Bildungsrenditen ermöglichen. 


3! Eine Möglichkeit bietet die Verwendung des Hausman-Taylor-Schätzers. Es ist jedoch 
häufig nicht möglich geeignete Instrumente zu finden. Vgl. Hausman/Taylor (1981). Eine 
weitere Möglichkeit besteht in der Verwendung von GMM-Schätzern, die jedoch weitere 
Probleme mit sich bringen. Vgl. Lee (2002). 


Steffen Wirth - 978-3-631-75476-4 
Downloaded from PubFactory at 01/11/2019 04:32:44AM 
via free access 


15 
3. Nichtparametrische Ansätze zur Messung von Bildungsrenditen 


Die in Abschnitt 2.2 dargestellten traditionellen Verfahren zur Schätzung der 
Mincer’schen Lohnfunktion (2.1) ermöglichen durchweg die Punktschätzung 
der Bildungsrenditen. Unabhängig davon, ob OLS-Regressionen, Quantilregres- 
sionen oder IV-Schätzungen verwendet werden, unterstellt man dabei jeweils, 
dass die Rendite eines zusätzlichen Bildungsjahres für alle Individuen gleich 
und, noch wichtiger, unabhängig vom Bildungsniveau ist. Obwohl sich diese 
Spezifikation in der überwiegenden Mehrzahl der Studien durchsetzte, gab und 
gibt es durchaus Studien, die alternative Spezifikationen verwenden. So werden 
beispielsweise anstelle der Zahl der Bildungsjahre als Indikator für das Bil- 
dungsniveau Dummyvariablen für Bildungsabschlüsse in die Modelle aufge- 
nommen. Als Ergebnis dieser alternativen Spezifikation erhält man in der Regel 
selbst nach Umrechnung der Dummykoeffizienten in jährliche Renditen große 
Unterschiede zwischen den Renditen der Bildungsabschlüsse.' Bei der Verwen- 
dung von Instrumenten für die Bildungsvariable zeigen sich je nach verwende- 
tem Instrument teilweise noch größere Unterschiede, nicht selten bis zu 10 Pro- 
zentpunkten, zwischen den geschätzten Bildungsrenditen. Das Vertrauen in 
diese Punktschätzungen hängt dabei sehr stark von der Gültigkeit der Annahmen 
bezüglich der verwendeten Instrumente ab. 


Angesichts dieser so unterschiedlichen Schätzungen der Bildungsrenditen stellt 
sich die Frage, ob es nicht möglich ist, Obergrenzen für die Bildungsrenditen zu 
schätzen. In diesem dritten Kapitel sollen nun alternative Schätzverfahren darge- 
stellt und diskutiert werden, die bislang vor allem in Evaluationsstudien zur 
Schätzung so genannter Treatmenteffekte verwendet wurden. Im Gegensatz zu 
den im zweiten Kapitel besprochenen Schätzern erfordern diese Verfahren in der 
Regel wesentlich weniger restriktive Annahmen und ermöglichen eine nichtpa- 
rametrische Analyse der Bildungsertragsraten. Wie sich zeigen wird, führen 
diese weniger restriktiven Annahmen lediglich zu Punktschätzungen von Ober- 
und Untergrenzen für die Bildungsrenditen. Punktschätzungen der Bildungsren- 
diten sind mit diesen nichtparametrischen Verfahren nicht mehr identifizierbar. 


Identifizierbarkeit und Identifikationsanalyse im Allgemeinen stehen im Mittel- 
punkt von Abschnitt 3.1, in dem auch der im Folgenden verwendete und sich 
von den traditionellen Modellen unterscheidende Modellrahmen eingeführt 
wird. (Abschnitte 3.1.1 und 3.1.2) In Abschnitt 3.1.3 wird die Bedeutung der 
exogenen Treatmentselektion (ETS) im Rahmen der Identifikationsanalyse und 


! Vgl. Lauer/Steiner (2001), S. 114. 
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der durchschnittliche Treatmenteffekt besprochen. Um einen Eindruck von der 
Vielfalt der im Rahmen von Evaluationsstudien verwendeten Treatmenteffekte 
Zu vermitteln, werden dabei auch Varianten dieses durchschnittlichen Treat- 
menteffekts in Abschnitt 3.1.4 vorgestellt. Abschließend werden in Abschnitt 
3.1.5 die wichtigsten der im Rahmen der mikroökonometrischen Evaluations- 
studien verwendeten Ansätze zur Lösung des Identifikationsproblems kurz dar- 
gestellt. 


Abschnitt 3.2 stellt den umfangreichsten Teil der Arbeit dar. In ihm werden die 
später im empirischen Teil evaluierten nichtparametrischen Ansätze ausführlich 
vorgestellt und diskutiert. Sie unterscheiden sich grundlegend von den in Ab- 
schnitt 3.1.5 dargestellten Verfahren. In Abschnitt 3.2.1 werden deshalb Struk- 
tur, Gemeinsamkeiten und Unterschiede dieser nichtparametrischen Lösungsan- 
sätze herausgearbeitet. In den Abschnitten 3.2.2 bis 3.2.7 werden dann die An- 
sätze, die sich insbesondere zur nichtparametrischen Analyse von Bildungsren- 
diten eignen, ausführlich diskutiert. Dabei werden in Abschnitt 3.2.2 mit den 
Worst-Case-Grenzen insofern Referenzgrenzen bestimmt als dabei auf jedwede 
Annahme über die nicht identifizierten Größen verzichtet und für diese jeweils 
die schlechtest möglichen Werte verwendet werden. Die darauf folgenden An- 
sätze benützen zum einen Annahmen, die aus dem Bereich der Produktions- 
theorie entlehnt werden — Abschnitt 3.2.3 — und beispielsweise unterstellen, dass 
bei einem zusätzlich investierten Bildungsjahr das Einkommen einer Person 
zumindest nicht sinken kann. Zum anderen werden Annahmen — Abschnitt 3.2.4 
— verwendet, die bei der Analyse der Bildungsjahre den Selektionsprozess in die 
Treatments, hier die Bildungsjahre, berücksichtigen. In Abschnitt 3.2.5 werden 
dann der Produktions- und der Selektionsaspekt durch die Annahme monotoner 
Instrumentalvariablen und monotoner Responsefunktionen kombiniert und mit 
der vielen Interpretationen von Schätzungen der Lohnfunktionen zugrunde- 
liegenden Annahme exogener Treatmentselektion (ETS) verglichen.” Abschnitt 
3.2.6 greift auf das Roy-Modell zurück, in dem die Individuen sich für die Aus- 
bildung mit dem größten erwarteten Lebenseinkommen entscheiden. Insoweit 
wird im Roy-Modell wie in Abschnitt 3.2.4 und 3.2.5 der Selektionsprozess be- 
rücksichtigt. Abschließend werden in Abschnitt 3.2.7 die Grenzen für Erwar- 
tungswerte und Treatmenteffekte der wichtigsten Ansätze ausführlich mitein- 
ander verglichen. 


* In Manski (1995), S. 143, wird ausführlich gezeigt, warum die Verwendung solcher 


Regressionen zur Bestimmung von Treatmenteffekten die Annahme von ETS impliziert. In 
Abschnitt 3.1.3 wird näher auf die Annahme von ETS eingegangen. 
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Ein allgegenwärtiges Problem empirischen Arbeitens in vielen Varianten stellen 
fehlerhafte und unvollständige Daten dar. In Abschnitt 3.3 wird die Identifikati- 
onsanalyse daher auf zwei im Bereich der robusten Verfahren verwendete 
Datenfehlermodelle angewandt. Entsprechend der Vorgehensweise aus Ab- 
schnitt 3.2 wird untersucht, welche Grenzen auf der Grundlage der Daten- 
fehlermodelle beispielsweise für die Quantile und den Erwartungswert angege- 
ben werden können. Es zeigt sich, dass die robusten Verfahren insoweit zu kon- 
servativ sind, als sie auf ex ante Inferenz ausgerichtet sind und deshalb im Ge- 
gensatz zu der auf ex post Inferenz basierenden Identifikationsanalyse Stichpro- 
beninformationen verschenken. Durch die Berücksichtigung von Stichprobenin- 
formationen kann mit der hier verwendeten Identifikationsanalyse im Gegensatz 
zu den robusten Verfahren eine Unter- und Obergrenze für den Erwartungswert 
angegeben werden. 


Bildungsertragsraten werden nicht nur zur Analyse von Lohnstrukturen, sondern 
schon seit längerem auch zur Messung von Lohndiskriminierung verwendet. 
Dies geschieht traditionell auf der Grundlage der so genannten Oaxaca/Blinder- 
Zerlegung’, die üblicherweise OLS-Regressionen oder Quantilregressionen ver- 
wendet. In Abschnitt 3.4 wird in Ergänzung zur bisherigen Methodik erstmals 
überprüft, ob und in welchem Maße die dargestellten Verfahren neue Einsichten 
in die Messung der Lohndiskriminierung erlauben. 


3.1 Das Identifikationsproblem 
3.1.1 Identifikation und Inferenz 


Seit mehr als einem Jahrhundert nützt die empirische Forschung in den Sozial- 
wissenschaften Methoden der Statistik.‘ In der Regel werden dabei Stichproben- 
daten verwendet, um auf der Grundlage von Annahmen über die Grundgesamt- 
heit und eines datengenerierenden Prozesses mit Hilfe der Inferenzstatistik Aus- 
sagen über ausgewählte Parameter der Grundgesamtheit treffen zu können. Bei 
diesen Verfahren treten neben statistischen Problemen häufig auch so genannte 
Identifikationsprobleme auf. Da alle in diesem Kapitel noch vorzustellenden 
Annahmen zu Identifikationsproblemen führen, soll im Folgenden zuerst der 
Begriff des Identifikationsproblems definiert und dann der Unterschied zu 
Problemen der statistischen Inferenz herausgearbeitet werden.” 


° Vgl. Oaxaca (1973) und Blinder (1973). 
* Vel. Stigler (1986). 
° Vgl. Manski (1995), S. 4. 
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Die Trennung von Identifikations- und Inferenzproblemen geht zurück auf 
Koopmans’, der 1949 die Begriffe der Identifikation und der Identifizierbarkeit 
einführte. Er beschäftigte sich fundierter als bis dahin üblich mit der Frage, wel- 
che Probleme bei der Bestimmung eines Parameters aufgrund einer ausreichen- 
den Anzahl an Beobachtungen auftreten, und charakterisierte Identifikations- 
analyse und Inferenzstatistik folgendermaßen: 


e Im Rahmen der Identifikationsanalyse untersucht man die Schlussfolge- 
rungen, die möglich wären, wenn ein gegebener datengenerierender Pro- 
zess eine unbegrenzte Anzahl an Beobachtungen erzeugen könnte. 


e Im Rahmen der Inferenzstatistik dagegen werden die im Allgemeinen 
schwächeren Schlussfolgerungen untersucht, die bei einer endlichen An- 
zahl an Beobachtungen möglich sind. 


Die Abbildungen 3.1 und 3.2 sollen diese Unterscheidung verdeutlichen. Den 
Abbildungen liegen hypothetische Stichproben (y,x) vom Umfang 100 bzw. 
1000 aus einer Grundgesamtheit zugrunde, in der die Variable x Werte aus den 
Intervallen [0,4] und [6,8] und y aus dem Intervall [0,8] annimmt.’ Anhand die- 
ser Stichproben wurden Konfidenzintervalle für die bedingten Erwartungswerte 
GEI ermittelt und in den Abbildungen durch die Punkte gekennzeichnet. 


Abbildung Konfidenzintervalle, Abbildung Konfidenzintervalle, 


3: 100 Beobachtungen a 1000 Beobachtungen 
o Untergrenze : Obergrenze e Untergrenze » Obergrenze 

8 81 
6 6 | 
4 4 

2 2 | 

0 2 4 8 0 2 4 6 8 
X x 


Die Länge der Konfidenzintervalle stellt nun das Inferenzproblem dar. Durch 
Erhöhen des Stichprobenumfangs kann das Intervall für y im Bereich [0,4] und 
[6,8] immer weiter verringert werden. Das Erhöhen des Stichprobenumfangs 
ändert an der Informationslage im Bereich (4,6) dagegen nichts. Unabhängig 


© Vgl. Koopmans (1949), S. 132. 
7 Vgl. Manski (1995), S. 7. 
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davon, wie viele Beobachtungen vorliegen, kann allein aufgrund des datenge- 
nerierenden Prozesses und ohne weitere Annahmen nichts tiber die Verteilung 
der Zufallsvariablen y in diesem Bereich ausgesagt werden. Im Bereich (4,6) 
liegt somit ein Identifikationsproblem vor. Verführerisch und in der Praxis nicht 
unüblich ist es, in diesem Bereich einfach zu extrapolieren und die Grenzen der 
Konfidenzintervalle an den Stellen 4 und 6 linear miteinander zu verbinden. 
Dies beruht dann aber auf der Annahme, dass der bedingte Erwartungswert in 
diesem Bereich linear verläuft. 


Ein häufig verwendetes Beispiel für das Identifikationsproblem in der Ökono- 
metrie geht zurück auf Working (1927) und betrifft die Bestimmung der struktu- 
rellen Form von Angebot und Nachfrage anhand der Beobachtung von Preisen 
und Mengen in Verbindung mit einer Gleichgewichtsbedingung. Das mit Ange- 
bots- und Nachfragefunktionen sowie einer Gleichgewichtsbedingung gebildete 
simultane Gleichungssystem wird dahingehend untersucht, welche der Glei- 
chungen exakt, über- oder unteridentifiziert sind. Weitere bekannte Identifikati- 
onsprobleme treten in der Soziologie bei der Unterscheidung so genannter endo- 
gener und korrelierter Effekte auf, die beispielsweise in Manski (1993a) aus- 
führlich besprochen werden. 


In den folgenden Abschnitten gilt es nun nicht, ein simultanes Gleichungssystem 
zu lösen. Wenn man die Bildungsrendite einer Person als Frage "Welchen (zu- 
sätzlichen) Lohn könnte eine bestimmte Person erwarten, wenn sie ein Jahr 
mehr in Bildung investiert hätte?" formuliert, steht man vor dem unlösbaren 
Problem, dass die dafür nötige Vergleichssituation nie beobachtet werden kann. 
Dieses unlösbare Problem wird auch als fundamentales Evaluierungsproblem 
bezeichnet.® 


Das Identifikationsproblem im Hinblick auf diese Fragestellung "Was wäre 
wenn?" stellt sich damit besonders deutlich als Problem der bedingten Prognose 
dar.” Wenn man die gestellte Frage beantworten möchte, muss man Annahmen 
treffen und diese mit Informationen aus der Stichprobe kombinieren. Wie schon 
angedeutet, erlauben die dazu im Folgenden dargestellten Annahmen lediglich 
Punktschätzungen der Unter- bzw. Obergrenzen, und damit nur eine Antwort auf 
die Frage "Welchen (zusätzlichen) Lohn kann eine Person mindestens bzw. 
höchstens erwarten, wenn sie ein Jahr mehr in Bildung investiert?". Dass man 
anstelle von Punktschätzungen von Parametern Punktschätzungen von Grenzen 


® Vgl. Schmidt (2000), S. 429. 
? Vgl. Manski (1995), S. 7. 
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erhält, ergibt sich beispielweise auch im Fall der umgekehrten Regression ("Re- 
verse Regression"). Hier ermittelt man durch Hilfsregressionen, bei denen ab- 
hängige und erklärende Variablen vertauscht werden, ebenfalls Unter- und 
Obergrenzen für die Bildungsertragsraten. In diesem Zusammenhang wurde 
auch der Begriff partiell identifizierter Parameter eingeführt." 


Im nächsten Abschnitt wird der im folgenden verwendete Modellrahmen einge- 
führt. Auf dieser Grundlage wird dann in Abschnitt 3.1.3 herausgearbeitet, wel- 
che Annahme der traditionellen Verfahren restriktiv bzw. stark genug war, um 
eine Punktschätzung der Rendite zu ermöglichen." 


3.1.2 Modellrahmen und Notation 


Warum konnten die Modelle im zweiten Kapitel die Bildungsertragsraten identi- 
fizieren? Innerhalb des Modellrahmens, der nun eingeführt wird, ist dies darauf 
zurückzuführen, dass bei den traditionellen Modellen implizit Unabhängigkeit 
der Wahl des Bildungsabschlusses und der Durchschnittslohnfunktion einer Per- 
son unterstellt wird. Sehr selten wird im Rahmen dieser Modelle und Analysen 
deutlich gemacht, dass damit für Personen mit unterschiedlichen Bildungsab- 
schlüssen dieselbe Durchschnittslohnfunktion und damit auch dieselbe Bil- 
dungsertragsrate angenommen wird. Personen, die zwölf Jahre in Bildung in- 
vestiert haben, können demnach denselben Lohn erwarten wie Personen, die 
dreizehn Jahre in Bildung investiert haben, vorausgesetzt, sie hätten anstelle von 
zwölf Jahren ebenfalls dreizehn investiert. Wie im Folgenden gezeigt wird, lässt 
sich damit die Differenz der Erwartungswerte bei dreizehn und bei zwölf Jahren 
bzw. die Differenz bei allen anderen Vergleichen von Bildungsjahren als jewei- 
lige Bildungsertragsrate interpretieren, die entsprechendes Normieren in die 
durchschnittliche jährliche Rendite umgerechnet werden kann. Wird diese An- 
nahme der Unabhängigkeit von Bildungsabschluss und Durchschnittslohnfunk- 
tion dann noch wie in den meisten Untersuchungen mit der Annahme kombi- 
niert, dass der Ertrag eines zusätzlichen Bildungsjahres — wieder für jedes Indi- 
viduum — konstant bzw. unabhängig vom realisierten Bildungsniveau ist, wird 
für eine gegebene Stichprobe genau eine einzige Bildungsrendite geschätzt. 


10 Vgl. Leamer (1981), S. 327. 
I! Vgl. Manski (1995), S. 3, zum Zusammenhang der "Produktion" erwiinschter Ergebnisse 
und der Verwendung immer strengerer Annahmen. 
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Welche Implikationen haben diese beiden Annahmen fir die Identifikation von 
Bildungsertragsraten, wenn sie isoliert oder in Verbindung mit anderen Annah- 
men verwendet werden? Welche Konsequenzen folgen aus alternativen Model- 
lierungen, die von dieser angesichts der Debatten um den Einfluss von Fahig- 
keiten und sonstigen individuellen Effekten sehr gewagten Annahmenkombina- 
tion abweichen? 


Um diese Fragen und die weiteren Annahmen formal beschreiben zu können, 
wird der nachstehende Modellrahmen eingeführt. 


Jede Person j einer Grundgesamtheit J habe 
beobachtbare Kovariaten x; eX, 
eine spezifische Responsefunktion y,():T— Y, die sich gegenseitig aus- 
schließende und erschöpfende Treatments teT in Ergebnisse ver 


abbildet, 
ein realisiertes Treatment z E T und 


ein realisiertes Ergebnis y; := y;(z;). 


Das Ergebnis der Responsefunktion y;(t), t #z,, ist im Gegensatz zu dem reali- 
sierten Ergebnis y,:=y,(z;) nicht beobachtbar und wird deshalb als latentes 
Ergebnis bezeichnet. 


Grundlage zur Bestimmung von Bildungsertragsraten innerhalb dieses Modell- 
rahmens ist die Verteilung der Responsefunktionen, PlyC)x]. Mit Hilfe einer 
Zufallsstichprobe aus der Grundgesamtheit soll diese Verteilung analysiert wer- 
den. Die beobachtbaren Kovariaten x werden in zwei Gruppen, x=(w,v), 
X=WxV und ve V” unterteilt, da in Abschnitt 3.2.4 Instrumentalvariablen 
eingeführt werden. Die Variablen in w stellen Kovariaten und die Variablen in 
v Instrumentalvariablen dar. 


Angewendet auf die Lohnfunktionen entspricht dann 


die Lohnfunktion der Responsefunktion y(-), 
die Anzahl der Bildungsjahre den Treatments (ef, 


'2 Vgl. Manski/Pepper (2000), S. 997ff. 
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die Anzahl der realisierten Bildungsjahre der j-ten Person dem realisierten 
Treatment z peas 


der beobachtete Lohn der j-ten Person bei z, realisierten Bildungsjahren dem 
realisierten Ergebnis y,, 

der nicht beobachtbare Lohn y,(t), den die j-te Person bei t anstelle von z; 
Bildungsjahren erhalten wiirde, dem latenten Ergebnis y,(t), t#z,, 


die Verteilung der Löhne bei Variation der Bildungsjahre der Verteilung 
Ply(Jw] der Responsefunktionen, 


w zum Beispiel den Charakteristika "nichtselbständige, vollzeiterwerbstätige 
Männer" und v den verwendeten Instrumentalvariablen, z.B. das Anfangsge- 
halt der Lehrer oder ob beide Eltern bis zum achtzehnten Lebensjahr im 
Haushalt lebten." 


Die Kovariaten in w werden innerhalb dieses Modellrahmens im Sinne der De- 
finition einer interessierenden Gruppe von Personen verwendet. Der Gebrauch 
dieser Variablen unterscheidet sich damit von dem Gebrauch in den Regressi- 
onsmodellen aus dem zweiten Kapitel, die aufgrund der Annahme der Unabhän- 
gigkeit von Bildungsabschluss und Durchschnittslohnfunktion z.B. lineare be- 
dingte Erwartungswerte schätzen und dabei für den Einfluss dieser Kovariaten 
kontrollieren. '* 


Werden in den folgenden Abschnitten Grenzen für Treatmenteffekte, bedingt 
auf die Kovariaten, ermittelt, wird dabei implizit versucht, folgende Frage zu 
beantworten: 


"Among persons with the specified covariates, what would 
be the difference ... if all such ‚persons were assigned one 
treatment rather than the other?" 


Die Frage nach den für die Kontrolle "richtigen" Kovariaten bzw. daraus fol- 
gend nach dem "Omitted Variable Bias" stellt sich demzufolge hier nicht. 


3 Vgl. Ginther (2000), S. 111. 

14 Vgl. Manski (2000), S. 431, und Lechner (1998), S. 16. 

'S Vgl. Manski/Nagin (1998), S. 107. Das Zitat bezieht sich auf die Rückfallrate von 
Jugendstraftätern, die in diesem Artikel analysiert wird, gilt aber allgemein für die 
Verwendung von Kovariaten in den folgenden Kapiteln zur Untersuchung von 
Bildungsertragsraten. 
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Die Aufgabe besteht nun darin, Annahmen über die nicht identifizierbaren 
Größen zu treffen, um dann, zusammen mit den beobachtbaren Größen, Rück- 
schlüsse über interessierende Kenngrößen der Verteilung der nichtbeobacht- 
baren Responsefunktionen P[y()] ziehen zu können. Die Betrachtung wird sich 
auf die Analyse des Erwartungswertes und der Quantile, insbesondere des 
Medians, konzentrieren. Diese Kenngrößen folgen stochastischer Dominanz, 
weshalb Manski (1997a) für diese Größen den Begriff der D-Parameter ein- 
führte.!° Für einen Parameter, der stochastischer Dominanz folgt, gilt: 


F und G seien zwei Verteilungen einer Zufallsvariablen Y. Man sagt, dass die 
Verteilung F die Verteilung G stochastisch dominiert, wenn 
F|- 00, t]> G[-,t]. Ein Parameter dl folgt dann stochastischer Dominanz, 
wenn t(F)> t(G) und die Verteilung F die Verteilung G stochastisch dominiert. 


Zu der Klasse dieser D-Parameter gehören unter anderem eben der Erwartungs- 
wert der Responsefunktion, E[y(t)], an dem bereits die Grundproblematik skiz- 
ziert wurde, und die Quantile der Responsefunktion, aly(t)], die zusätzlich 
einbezogen werden, um die Verteilung der Löhne und damit auch die Treat- 
menteffekte differenzierter analysieren zu können. Parameter, die nicht sto- 
chastischer Dominanz folgen, sind beispielsweise die Varianz und der Inter- 
quartilsabstand. Diese D-Parameter werden dann dazu verwendet, um Grenzen 
für die entsprechenden D-Treatmenteffekte, beispielsweise die durchschnittliche 
Bildungsertragsrate, zu ermitteln. 


Einen weiteren formalen Rahmen zur Analyse von Bildungsertragsraten, der 
sich vor allem in der Literatur zur Evaluierung staatlicher Eingriffe herausgebil- 
det hat, bietet das Neyman-Fisher-Cox-Rubin-Modell potentieller Ergebnisse.” 
Bezeichnet man mit D; =1 das Erhalten eines Treatments, mit D; =0 das 


Nichterhalten und mit Y; das potentielle Ergebnis der i-ten Person, so gilt: 
31) Y=DY+(-D)Y . 
Üblicherweise wird die Indikatorvariable D; dann durch ein so genanntes laten- 


tes Variablen Modell erklärt. Man nimmt dabei an, dass die Zuordnung oder die 
Entscheidung für D; durch eine latente Variable D; bestimmt wird: 


'© Vgl. Horowitz/Manski (1995), S. 290. 
"7 Vgl. Heckman/Vytlacil (2001a), S. 6, Heckman/Vytlacil (2001b) und Schmidt (2000), S. 
430. 
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Dj =Hp(Z;)— Up, 


(3.2) f für D'>0 ` 
D; = 1 
0 sonst 


Z; ist ein Vektor beobachteter Zufallsvariablen, U, eine unbeobachtete 


Zufallsvariable und D; der Nettonutzen, der sich aus der Wahl des Treatments 
ergibt. Damit kann das potentielle Ergebnis bei Treatment, Y,,, und das poten- 
tielle Ergebnis bei Nicht-Treatment, Wa, in Abhängigkeit beobachtbarer 
Zufallsvariablen X, formuliert werden: 


Y, =u (X, U) 
3.3 Y. = li t i? “hi ; 
GE ' Re "He RER 


Damit kann der Treatmenteffekt A; geschrieben werden als 


Obwohl dieser Rahmen inzwischen weit verbreitet ist, wird er im Folgenden 
nicht weiterverwendet. Erstens erscheint das eingangs dargestellte Modell zur 
nichtparametrischen Analyse der Treatmenteffekte, dem Hauptthema der vorlie- 
genden Arbeit, besser geeignet und zweitens erlaubt es eine deutlichere Tren- 
nung zwischen Annahmen, die Selektion in Treatments betreffend, und Annah- 
men in Bezug auf den Zusammenhang zwischen Ergebnis- und Treatmentvari- 
able. 


3.1.3 Identifikation von Treatmenteffekten 


In Abschnitt 3.1.3.1 wird formal dargestellt, warum die Annahme der Unabhän- 
gigkeit der Wahl des Bildungsabschlusses und der Durchschnittslohnfunktion in 
Kombination mit linearen Responsefunktionen zur Identifikation der Bildungs- 
ertragsrate führt. In Abschnitt 3.1.3.2 wird stellvertretend für die Vielzahl der 
Treatmenteffekte, die auch in Abschnitt 3.1.4 angesprochen werden, der in der 
Literatur bisher am häufigsten verwendete und eng mit der Durchschnittslohn- 
funktion verbundene durchschnittliche Treatmenteffekt (ATE) behandelt. Re- 
striktionen des Modellrahmens und die Strategie zur Auswahl von Annahmen 
werden in Abschnitt 3.1.3.3 vorgestellt. 
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25 
3.1.3.1 Exogene Treatmentselektion (ETS) 


Mit der eingeführten Notation lässt sich nun die erste Annahme, dass Personen 
mit sonst gleichen Charakteristika w trotz unterschiedlichen Bildungsabschlüs- 
sen dieselbe Durchschnittslohnfunktion aufweisen, folgendermaßen schreiben. 


Für jeden Bildungsabschluss, also jedes Treatment t e T, gilt: 
(3.5) Ely(t}w,z = u |= Ely(t)}w,z = u, | 


Der Erwartungswert des Lohnsatzes der Personen, die u, =12 Bildungsjahre 


realisiert haben, entspricht bei t Bildungsjahren annahmegemäß dem Erwar- 
tungswert der Personen bei t Bildungsjahren, die u, =13 Bildungsjahre reali- 


siert haben. 


Diese Annahme bezeichnet man als "Exogenous Treatment Selection (ETS)""®, 
da unterstellt wird, dass die Wahl des Bildungsabschlusses von der Durch- 
schnittslohnfunktion Ely(t}w] unabhängig jet! Dass diese Annahme zur 


Identifikation der Bildungsertragsrate führt, muss nicht verwundern. Anhand der 
Definition in (3.5) wird deutlich, dass durch die Annahme von ETS das Problem 
der Vergleichssituation im Hinblick auf die Identifikation des Treatmenteffekts 
gelöst ist. Man braucht demnach beispielsweise für die Personen mit u, =12 


Bildungsjahren keine Vergleichssituation, denn wegen der Unabhängigkeit des 
Bildungsabschlusses von der Durchschnittslohnfunktion kann man stattdessen 
die Löhne der Personen mit u, =13 Bildungsjahren verwenden. Führt man nun 


zusätzlich die Annahme konstanter jährlicher, für jedes Individuum gleicher, 
Bildungsrenditen ein, lässt sich dies als lineare individuelle Responsefunktion 
formulieren: 


(3.6) y,(t)=B-tt+e, . 


'8 Alternative Bezeichnungen sind: "ignorable selection" (Manski (1995)), und in anderem 
Zusammenhang "exogenous switching" (Maddala (1983)) und "ignorable treatment 
assignment" (Rosenbaum/Rubin (1983)). Vgl. Manski (1995), S. 31 ff. 

" Manski (1995), S. 31, führt als Beispiel zur Verwendung der ETS Annahme aus der 
"Praxis" die Vorgehensweise des U.S. Bureau of Census an, die bei der Behandlung des 
Nonresponse-Problems annehmen, dass die Verteilung der nicht angegebenen Einkommen 
der Verteilung der berichteten Einkommen entspricht. In Abschnitt 3.3 wird gezeigt, dass 
es sich dabei um ein spezielles Datenfehlermodell handelt. 
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Die Kombination der Annahme (3.6) mit der Annahme der Unabhängigkeit von 
Bildungsabschluss und Durchschnittslohnfunktion (3.5) ermöglichte — siehe 
zweites Kapitel — die Identifikation bzw. die Punktschätzung der Bildungser- 
tragsrate B. 


Bevor auf mögliche Abwandlungen dieser Annahme und damit auf die ausführ- 
liche Darstellung von Alternativen eingegangen wird, sollen zunächst das Identi- 
fikationsproblem und die daraus resultierenden Konsequenzen für die Bestim- 
mung von Treatmenteffekten, bzw. Bildungsertragsraten beschrieben werden. 


3.1.3.2 Der durchschnittliche Treatmenteffekt (ATE) 


Die nichtparametrischen Arbeiten zum Identifikationsproblem in den Sozialwis- 
senschaften haben ihren Ursprung in der Analyse des Selektionsproblems. Dabei 
wurde und wird untersucht, wie bedingte Wahrscheinlichkeitsverteilungen 
P(y|x) aus Stichproben identifiziert werden konnen, bei denen die Realisationen 


der bedingenden Variablen (x) immer, die Realisationen der bedingten Variab- 
len (y) jedoch nur teilweise beobachtbar und damit zensiert sind. Unser Identifi- 
kationsproblem bei der Bestimmung von Bildungsertragsraten stellt sich so dar, 
dass fiir eine bestimmte Person der Lohn immer, aber dafiir nur bei gegebenem, 
nicht aber bei höherem oder niedrigerem Ausbildungsniveau beobachtbar ist. 
Das Identifikationsproblem unterscheidet sich damit von dem Selektionsprob- 
lem bei zensierten Stichproben dadurch, dass- von Abschnitt 3.3 abgesehen — 
für alle Personen Beobachtungswerte sowohl für die bedingende als auch für die 
bedingte Variable vorliegen. Mit der eingeführten Notation lassen sich beide 
Fälle wie folgt schreiben. Im Fall zensierter Stichproben, dargestellt am Beispiel 
von Löhnen (y) und der Erwerbsbeteiligung (z=1 Erwerbsbeteiligung, z = 0 
keine Erwerbsbeteiligung), setzt sich die Verteilung der Löhne P(ylx) 


zusammen als: 


(3.7)  Plyx)= Plyx,z=1)-P(z = 1x)+ P(yx,z = 0): P(z = Ox) . 


— 
beobachtbar beobachtbar nicht beobachtbar 
beobachtbar 


Der Lohn kann nur für die Personen beobachtet werden, die am Erwerbsleben 
teilnehmen (z = 1). Um die Verteilung P(ylx) schätzen zu können, müssen des- 


halb Annahmen über die nichtbeobachtbaren Löhne der Personen getroffen wer- 
den, die nicht am Erwerbsleben teilnehmen (z=0). 
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Dagegen setzt sich in unserem Fall die Verteilung der Löhne bei einem be- 
stimmten Wert t der Treatmentvariablen, Ply(t}w, aus folgenden Teilen zusam- 


men: 


(3.8) Ply(t)\w | = Ply(tJw,z = d P(z = tlw) + Ply(tJw,z # d P(z # tw) 
beobachtbar beobachtbar nicht beobachtbar 


beobachtbar 


Für die Personen, die ein anderes Treatment als t, z#t, realisiert haben, ist 
zwar NÉI OH nicht beobachtbar, es ist jedoch im Unterschied zum vorangegan- 
genen Beispiel fiir diese Personen die Verteilung Ply(z = tw] beobachtbar. 


Diese Zusatzinformation bietet den Ansatzpunkt für die in den folgenden Ab- 
schnitten dargestellten Lösungsansätze. 


Das Identifikationsproblem, das bei der Bestimmung der Verteilung Ply(t}w] 
auftritt, überträgt sich auf die Bestimmung von Treatmenteffekten. Beispiels- 
weise müssen zur Schätzung der Änderung des Durchschnittslohnsatzes A), >; 
in (3.9) die Erwartungswerte Ely(12)w] und Ely(13)\w] identifiziert werden, 


die sich auf die hypothetische Situation beziehen, dass — wie in unserem Ein- 
gangsbeispiel — alle Personen dieser Stichprobe bei sonst gleichen Charakteris- 
tika t, =12 Jahre bzw. t, =13 Jahre in Bildung investieren würden: 


39) Ann = Ely(3)\w]- Ely(12)w] . 


Diese Differenz der Erwartungswerte wird in der Literatur als "Average Treat- 
ment Effect (ATE)" oder auch als Kausaleffekt bezeichnet.” 


Die beiden Erwartungswerte der Responsefunktion Ely(13)\w] und Ely(12)|w] 
lassen sich unter Verwendung bedingter Erwartungswerte schreiben als" 


E[y(13)]= Ely(13)]z = 13]- P(z = 13)+ Elya 3z = 12]- P(z = 12) 


"` Susi Elya2ye lte = 12)+B[y(2)2-=13}-P(@ =13) 


2 Vgl. Lechner (1998), S. 15. | 
! Der Übersichtlichkeit halber wird in Formeln auf die Konditionierung auf w verzichtet, 
falls dies das Verständnis nicht erschwert. 
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Der durchschnittliche Treatmenteffekt A,, 3 = Ely(13)w]- Ely(12)}w] in unse- 
rem Beispiel ergibt sich dann als: 


Aua = E[y(13)]- Ely(12)] 
(3.11) = Ely(13)z = 13]- P(z = 13) + Ely(13)|z = 12]- P(z = 12) 
- Bly(12)|z = 12]: P(z = 12) + Elya 2z = 13]- P(z = 13) 


Von den zur Bestimmung dieses Effektes benötigten Größen können aber aus 
einer Zufallsstichprobe von Individuen lediglich die bedingten Erwartungswerte 
Ely(13)|w,z =13] und E[y(12)|w,z=12] sowie P(z=13w) und Ps =12\w) 
geschätzt werden. Die latenten, bedingten Erwartungswerte Ely(13)|w,z = 12] 
und Ely(12) 


bezeichnet. Da diese nicht identifiziert werden können, ist auch der durch- 
schnittliche Treatmenteffekt A,, ,, — wie eingangs schon diskutiert - wegen dem 


W,Z= 13] werden üblicherweise als "counter-factual outcome" 


fundamentalen Evaluierungsproblem selbst aus einer unendlich groBen Stich- 
probe nicht bestimmbar. Das Identifikationsproblem wird deshalb manchmal als 
Problem fehlender Daten bezeichnet.” 


Im zweiten Kapitel wurde dieses Identifikationsproblem innerhalb der dort be- 
schriebenen Regressionsmodelle nicht explizit formuliert, aber implizit unter 
Akzeptanz bzw. Verwendung der Annahme von ETS gelöst.” Dies soll hier 
exemplarisch wieder am durchschnittlichen Treatmenteffekt gezeigt werden. 


Nun wurde die bei den Standardlohnfunktionen implizit verwendete Annahme 
von ETS in (3.5) bereits als Identität der bedingten Erwartungswerte 
Ely(t)w,z = u, |= Ely(t}w,z =u,| formuliert. Auf das Beispiel angewandt, 
folgt daraus für die bedingten Erwartungswerte der latenten Ergebnisse: 


3.12) <n = an es 


w,z=12 
Ely(13)|w,z =12 (13) l 


w,z=13 


?2 Schmidt (2000) übersetzt counter-factual als kontrafaktisch. 

*? Vgl. Blundell/Costa Dias (2002), S. 1. 

4 Vgl. Manski (2000), S. 431. Im Bereich der "Classical Randomized Experiments" ist die 
ETS Annahme wohlbegriindet, jedoch nicht bei Experimenten, deren Design davon 
abweicht. 

Steffen Wirth - 978-3-631-75476-4 


Downloaded from PubFactory at 01/11/2019 04:32:44AM 
via free access 


29 


Der Erwartungswert der Löhne derjenigen, die eine Bildungsinvestition von 12 
Jahren aufweisen, wäre also, wenn sie stattdessen eine Bildungsinvestition von 
13 Jahren getätigt hätten, identisch mit dem Erwartungswert derer, die 13 Jahre 
in die Bildung investiert haben. Die Annahme von ETS lässt sich ökonomisch so 
interpretieren, dass bei vollkommenen Kapitalmärkten die Individuen indifferent 
zwischen verschiedenen Bildungsniveaus sind, da die höheren Löhne lediglich 
die Schulkosten und den Verdienstausfall aufgrund der zusätzlich investierten 
Zeit kompensieren. 


Nun kann der durchschnittliche Treatmenteffekt (ATE) identifiziert werden, in- 
dem die Erwartungswerte der latenten bedingten Erwartungswerte in (3.11) 
durch die entsprechenden Werte aus (3.12) ersetzt werden" 


Aus = Ely(13)]- E[y(12)] 
= E[y(13)|z = 13]- P(z = 13)+ E[y(13)z = 13]- P(z = 12) 
- Ely(12)\z = 12]- P(z = 12)+ Elya 2z = 12]- P(z = 13) ` 
= E[y(13)z = 13]- Ely(12)z = 12] 


(3.13) 


Bei Gültigkeit der Annahme von ETS entspricht der ATE somit der Differenz 
der beobachtbaren, bedingten Erwartungswerte 


Men t, |- Ely(t,)}w,z u d 


(3.14) A, =Elylt) 


Im Rahmen der Analysen von Lohnfunktionen im zweiten Kapitel wurde die 
Annahme von ETS mit einer log-linearen Funktionsform für die Responsefunk- 
tionen verknüpft. Als Ergebnis erhielt man eine für alle Personen identische und 
für alle Bildungsjahre konstante Bildungsertragsrate. 


Zu diesem Spezifikationsproblem kommt jedoch hinzu, dass die Annahme exo- 
gener Treatmentselektion empirisch nicht testbar ist. Grundlage eines solchen 


Tests müsste der bedingte Erwartungswert hue. AZ | sein. 


25 Es gibt noch eine Reihe weiterer Effekte, auf die hier nicht näher eingegangen werden soll, 
z.B. den "Classical Treatment Effect (CTE)", den "Status Quo Treatment Effect (STE)", 
vgl. Manski/Nagin (1998), sowie den "Intention to Treatment Effect", Manski (1996), S. 
711. 
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Da dieser nicht identifizierbar ist, gibt es keine Grundlage, um die Hypothese 


(3.15) Ely(t)}w,z = u, |= Ely(t)w,z = u, | 


zu verwerfen. 


3.1.3.3 Restriktionen und Annahmenselektion 


Die bisher verwendete Betrachtungsweise geht zurück auf das im Rahmen 
mikroökonometrischer Evaluationsstudien entwickelte Modell potenzieller Er- 
gebnisse.” Hier vergleicht man das Ergebnis eines Individuums bei Teilnahme 
an einer Maßnahme mit dem Ergebnis bei Nichtteilnahme, wobei dann der kau- 
sale Effekt als Differenz der potenziellen Ergebnisse definiert wird. Zusätzlich 
zu dem bereits dargestellten Identifikationsproblem muss hier angenommen 
werden, dass die potenziellen Ergebnisse für jedes Individuum unabhängig vom 
Treatmentstatus anderer Individuen der betrachteten Grundgesamtheit sind. 
Diese Annahme nennt Rubin (1974) "Stable Unit-Treatment Value Assumption 
(SUTVA)".” Sie ist bei groß angelegten Programmen nicht unproblematisch, da 
zum Beispiel bei Arbeitsmarktmaßnahmen der Umfang des Programms durch- 
aus die Angebots-Nachfrage-Relation beeinflussen kann. SUTVA stellt somit 
eine wichtige Einschränkung der Gültigkeit von Evaluationsstudien dar.” In der 
Regel wird bei der Interpretation der Ergebnisse jedoch implizit von der Zuläs- 
sigkeit dieser Annahme ausgegangen. 


Aus zwei Gründen wird diese Problematik auch im Folgenden nicht weiter be- 
rücksichtigt. Erstens werden im vierten Kapitel die empirischen Resultate der 
Annahmen dieses Kapitels mit den empirischen Ergebnissen der Modelle aus 
dem zweiten Kapitel verglichen, bei denen SUTVA nicht angenommen und 
auch nicht diskutiert wurde. Zweitens soll im Folgenden im Unterschied zu den 


?° Vgl. Manski (2000), S. 431. 

"7 Vgl. Roy (1951) und Rubin (1974). 

*8 Synonym gebraucht werden die Begriffe "Abwesenheit von makroökonomischen 
Effekten", Garfinkel et al. (1992) und "Individualistic Treatment Effect", Manski/Nagin 
(1998). 

? Vgl. Angrist et al. (1996), S. 446. 

°° Vgl. Lechner (1998), S. 15ff., zu den vereinzelten Hinweisen, dass SUTVA durch andere 
Annahmen ersetzt werden könnte. 
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Studien zur Evaluation von Maßnahmen hauptsächlich ein Status-quo-Zustand 
bzw. eine zeitliche Folge von Status-quo-Zuständen, die Entwicklung der Lohn- 
struktur, analysiert werden. Man stellt dabei zwar implizit die Frage, was Perso- 
nen mit zj =t; Bildungsjahren verdienen könnten, wenn sie stattdessen zj = tz 


Bildungsjahre investiert hätten. Daraus sollen jedoch keine Schlussfolgerungen 
im Sinne der Empfehlung oder Evaluation von Bildungsmaßnahmen oder Bil- 
dungsreformen gezogen werden. 


Im Unterschied zu der in vielen empirischen Untersuchungen verwendeten An- 
nahme der statistischen Unabhängigkeit der Responsefunktionen von den 
Treatments (ETS) untersucht vor allem Manski’! schwächere Annahmen und die 
damit verbundenen Möglichkeiten, besagte Kenngrößen der Responsefunktio- 
nen zu identifizieren. Das Ziel besteht darin, die Glaubwürdigkeit der Analysen 
durch eine Lockerung der getroffenen Annahmen zu erhöhen, auch wenn da- 
durch keine exakte Identifikation der interessierenden Parameter mehr möglich 
ist, sondern nur noch ein entsprechender Korridor angegeben werden kann.” 
Manski unterscheidet drei in der Literatur vorzufindende Vorgehensweisen:” 


1) Man wählt einen Treatmenteffekt und verwendet Annahmen, die stark 
genug sind, um diesen Effekt zu identifizieren. 


2) Man verwendet Annahmen, die ausreichend schwach sind, um weitläufig 
glaubwürdig zu sein. Dann untersucht man, welche Treatmenteffekte bzw. 
Parameter unter diesen Annahmen identifiziert werden können. 


3) Man wählt einen Treatmenteffekt und Annahmen, die ausreichend 
schwach sind, um weitläufig glaubwürdig zu sein, und untersucht, was 
aufgrund dieser Annahmen über den Treatmenteffekt gelernt werden 
kann. 


Gemäß dieser Klassifikation der Strategien wird im Weiteren der dritten Vorge- 
hensweise gefolgt. Im Folgenden sollen die Auswirkungen verschiedener Bil- 
dungsniveaus auf die Verteilung der Löhne bzw. den D-Parametern untersucht 
werden und dabei in diesem Kapitel Annahmen verwendet werden, die ausrei- 
chend schwach sind, um weitläufig glaubwürdig zu sein. Dies soll auch dazu 


31 Vgl. Manski (1989, 1990, 1993b, 1994b, 1995, 1996, 1997a, 1997b, 2000, 2001). 

32 Vgl. Hübler (1998), S. 115, der dies als Pladoyer Manskis fiir die Ermittlung eines 
Korridors interpretiert. 

33 Vgl. Manski (1996), S. 712. 
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dienen, die im zweiten Kapitel durch die Verwendung verschiedener Modelle 
festgestellten Unterschiede in den Bildungsertragsraten relativieren zu können.”" 
Obwohl der dritten Vorgehensweise gefolgt wird und bereits der interessierende 
Treatmenteffekt sowie Annahmen ausgewählt wurden, werden in nächsten Ab- 
schnitt vier weitere Treatmenteffekte kurz dargestellt, um einen Eindruck zu 
vermitteln, welche weiteren Treatmenteffekte in der Literatur untersucht wer- 
den. 


3.1.4 Variationen des Treatmenteffekts 


Neben dem gerade behandelten durchschnittlichen Treatmenteffekt (ATE) wer- 
den in Evaluationsstudien häufig auch die beiden folgenden Effekte analysiert: 


(3.16) A, ty = Ely(t, )|w, z; = GL Ely(t,)|w,2, = t] > 
GIm Aya, = Elyte )w, z; =t- Elite, nl. 


(3.16) und (3.17) stehen für den Effekt einer Maßnahme auf ein zufällig aus der 


Gruppe der Teilnehmer zj =t, bzw. der Nichtteilnehmer zj =t; ausgewähltes 


Individuum. Der Treatmenteffekt (3.16) steht in vielen Evaluationsstudien im 
Vordergrund, da er den Maßnahmeerfolg für Personen angibt, die tatsächlich an 
dem Programm teilgenommen haben, und daher als Erfolgsindikator des Pro- 
gramms Verwendung findet.” (3.16) wird auch als "Treatment on the Treated 
(TT)", (3.17) als "Treatment on the Nontreated" bezeichnet. Außer diesen bei- 
den Treatmenteffekten können noch weitere untersucht werden. Im Rahmen der 
schon mehrfach angesprochenen Instrumentalvariablenansätze werden bei- 
spielsweise "Local Average Treatment Effects (LATE)" bestimmt. Hierbei misst 
man den durchschnittlichen Effekt (ATE) einer Maßnahme auf diejenigen Per- 
sonen, die durch eine Änderung der Instrumentalvariablen zu einer Teilnahme 
bewogen wurden. Der so genannte "Marginal Treatment Effect (MTE)" unter- 
sucht ebenfalls den durchschnittlichen Effekt einer Maßnahme, beschränkt die 


34 Vgl. Manski/Nagin (1998). Hier wird schon im Titel "Bounding disagreement ..." die 
Absicht offenkundig, die Unterschiede bezüglich Treatmenteffekten aufzuklären. Auch 
Manski/Pepper (2000) verwenden die Grenzen, um eine Referenzgröße zur Beurteilung 
von Bildungsertragsraten zu erhalten. 

35 Vgl. Lechner (1998), S. 17. 
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Betrachtung allerdings auf die Personen, deren Wahrscheinlichkeit fiir eine 
Teilnahme am geringsten oder am größten ist.” 


Diese Effekte wurden lediglich zu Vergleichszwecken herangezogen, da sie sich 
jeweils auf Teilpopulationen beziehen. Dagegen konzentriert sich die vorlie- 
gende Arbeit wegen der Vergleichbarkeit mit den Ergebnissen der vorange- 
gangenen Kapitel auf die Analyse des durchschnittlichen Treatmenteffekts.’’ 
Zudem ist die Übertragung der in Kapitel 3.2.4 vorgestellten Annahmen auf 
diese vier Effekte ohne größere Probleme möglich.” 


3.1.5 Einordnung in die Literatur der mikroökonometrischen Evaluations- 
studien 


Wie im zweiten Kapitel bereits gezeigt wurde, gibt es bei der Bestimmung von 
Bildungsertragsraten auf der Basis der Humankapitaltheorie in der Praxis einige 
Problembereiche. Zum Beispiel treten Identifikationsprobleme, resultierend aus 
fehlenden Informationen zu den Fähigkeiten oder anderen Charakteristika eines 
Individuums, und das Problem der Modellierung der Selbstselektion von Indivi- 
duen in Bezug auf den Bildungsabschluss auf. Korreliert beispielsweise die Fä- 
higkeit von Personen mit der Wahl des Bildungsabschlusses und den Löhnen, 
sind Schätzungen, die diese Korrelation nicht berücksichtigen, verzerrt. Um 
dann die Bildungsertragsraten identifizieren zu können, müssen Annahmen be- 
züglich dieses Selektionsprozesses getroffen werden. Dies kann wie im zweiten 
Kapitel im Rahmen von parametrischen oder semiparametrischen Modellen un- 
ter Verwendung relativ starker, zum Teil unplausibler und nicht testbarer An- 
nahmen” oder durch die Anwendung wesentlich schwächerer, dafür aber 
plausiblerer Annahmen im Rahmen von Modellen aus der Literatur zu mikroö- 
konometrischen Evaluationsstudien erfolgen, in denen die Wirkungen bei- 
spielsweise einer Weiterbildungsmaßnahme aus der Sicht der Teilnehmer 
und/oder Nichtteilnehmer empirisch untersucht werden. In der Regel hat dies- 
wie bereits angedeutet — jedoch die Konsequenz, dass die Bildungsertragsraten 
nicht mehr exakt identifiziert, sondern nur noch Unter- bzw. Obergrenzen und 
damit ein Korridor angegeben werden können.” 


°° Vgl. Heckman et al. (2000), S. 6ff. 

37 Vgl. Ginther (2000), S. 104, und Lechner (1998), S. 29. 

38 Vgl. Heckman/Vytlacil (2001a), S. 3, Fußnote 3, zu der Übertragung der Ergebnisse aus 
Abschnitt 3.2.4. 

Vgl. Manski/Pepper (2000), S. 997. 

Vgl. Hübler (1998), S. 115. 
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Im Folgenden werden daher verschiedene Annahmen dargestellt, die im Rahmen 
dieser Modelle verwendet werden können, um nichtparametrische Unter- und 
Obergrenzen fiir Wahrscheinlichkeiten, Erwartungswerte und Quantile von 
Treatmenteffekten zu identifizieren. Die Annahmen, die dann im empirischen 
Teil zur Identifikation von Obergrenzen fiir Bildungsertragsraten verwendet 
werden, gehen zurtick auf Manski (1989, 1990, 1994b, 1995, 1997a, 2000) und 
wurden bisher empirisch nur von Manski/Pepper (2000) und Ginther (2000) auf 
die Ermittlung von Bildungsertragsraten angewandt. 


Bevor in den nächsten Abschnitten im einzelnen auf diese Annahmen eingegan- 
gen wird, soll dargestellt werden, wie diese in die Literatur zu Evaluationsstu- 
dien einzuordnen sind. Dazu genügt es, diese Annahmen vorläufig zwei Grup- 
pen zuzuordnen. Die erste Gruppe, Abschnitt 3.2.3, setzt an der Modellierung 
der Responsefunktion an und hebt die Annahme auf, dass diese für alle Personen 
identisch ist. Die zweite Gruppe von Annahmen, Abschnitt 3.2.4, verwendet zu- 
sätzlich Instrumentalvariablen, um Selektionseffekte einbeziehen zu können. 


Blundell/Costa Dias (2002)*' unterscheiden im Bereich der Evaluationsstudien 
die in Übersicht 3.1 angegebenen fünf Forschungsrichtungen.” 
Ubersicht 3.1: Unterscheidung von Forschungsrichtungen 


(1) (2) (3) (4) (5) 


"Soziale" "Natürliche" | Matching- | Selektions- | Strukturelle Simu- 
Experimente | Experimente | Verfahren | modelle lationsmodelle 


(1) "Soziale" Experimente: Man versucht bei dieser Methode das Identifika- 
tionsproblem, dass zu einem Zeitpunkt nur ein Zustand für eine Person 
beobachtet werden kann, dadurch zu lösen, dass eine zusätzliche Zufalls- 
stichprobe der betrachteten Grundgesamtheit gezogen und als Vergleichs- 
bzw. Kontrollgruppe verwendet wird. Card/Robins (1998) beschreiben 
das kanadische "Self-Sufficiency"-Projekt, in dem das Arbeitsangebots- 
verhalten alleinerziehender Mütter untersucht wird und bei dem die Hälfte 
der in Frage kommenden Mütter per Zufall von einem bestimmten Pro- 
gramm ausgeschlossen wurden. In der Realität gibt es jedoch nur selten 
solche Experimente, da — neben ethischen Bedenken — diese vergleichs- 
weise teuer sind und zudem sichergestellt werden müsste, dass die Kon- 
trollgruppe von dem Programm nicht beeinflusst wird, Spill-over- bzw. 
Substitutions- und Gleichgewichtseffekte also nicht auftreten können. 


TT Vgl. Blundell/Costa Dias (2002), S. 1. 
Vel. F itzenberger/Prey (1998), S. 49, zu einer ähnlichen Einteilung. 
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"Natürliche" Experimente: Bei dieser Methode betrachtet man das Pro- 
gramm als solches als Experiment und versucht, unter den Nichtteilneh- 
mern eine Vergleichsgruppe im Sinne der Methode (1) zu finden. Eine 
Selektionsverzerrung, die auf zeitinvarianten beobachtbaren oder unbeob- 
achtbaren Charakteristika beruht, kann dann durch Differenzenbildung bei 
den bereits im zweiten Kapitel erwähnten Fixed-Effects-Modellen besei- 
tigt werden”. Dies wird deshalb auch als Methode der Differenz-von- 
Differenzen (DvD) bezeichnet. Ein Nachteil ist die dabei zu treffende 
Annahme, dass es keine gemeinsamen Zeiteffekte für beide Gruppen und 
keine Änderungen in der Zusammensetzung der Gruppen gibt.” 


Matching-Verfahren: Beim Matching-Ansatz versucht man das Identifi- 
kationsproblem dadurch zu lösen, dass man das beobachtbare Ergebnis 
eines Individuums bei Teilnahme an einem bestimmten Programm mit 
dem beobachtbaren Ergebnis eines in Bezug auf bestimmte Charakteris- 
tika annähernd gleichen Individuums vergleicht, das nicht an diesem Pro- 
gramm teilnimmt.“ Ein Vorteil des Matching-Verfahrens ist, dass sich die 
Schätzung der Varianz — je nach Matching-Verfahren mehr oder weniger 
stark — vereinfacht. Zudem kann man Matching dazu verwenden, aus der 
Untergruppe der Nichtteilnehmer eine Stichprobe zu erhalten, die der 
Kontrollgruppe aus dem Evaluationsansatz (1) entspricht. Die Problema- 
tik besteht unter anderem darin, die für das Matching entscheidenden Va- 
riablen zu finden (Problem der richtigen Variablen) bzw. überhaupt eine 
vergleichbare Person zu finden (Problem der fehlenden Uberlappung).”’ 
Diesen Matching-Verfahren ist die erste Gruppe der von Manski vorge- 
schlagenen Annahmen zuzuordnen, da auch sie sich im Gegensatz zu den 
in (4) verwendeten Selektionsmodellen lediglich auf beobachtbare Cha- 
rakteristika beziehen ("Selection on Observables"). 


Vgl. Fitzenberger/Prey (1998), S. 49. 
Zu weiteren möglichen Nachteilen der Methode vgl. Ashenfelter/Krueger (1994). 


® Vgl. Blundell et al. (1998). 


4 


an 


Vgl. Lechner (1998), S. 27ff., zu den verschiedenen Möglichkeiten der Bestimmung dieses 


Vergleichswertes. 


4 


N 


Vgl. Manski (2000), S. 431. Wie im Folgenden auch noch genauer beschrieben wird, ist 


der Begriff einer Kovariaten und damit einer "richtigen" Kovariaten mit Sorgfalt zu 
gebrauchen. Vgl. auch Lechner (1998), S. 16. 
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(4) Selektionsmodelle: Diese Modelle gehen zurück auf die Arbeiten von 


Heckman (1979) bzw. Heckman/Robb (1985, 1986) und wurden seither 
vielfältig erweitert.” Diesen Ansätzen liegt die Idee zugrunde, über die 
Berücksichtigung von Variablen, die zwar die Teilnahme an einer Maß- 
nahme bestimmen, jedoch mit dem Ergebnis der Maßnahme unkorreliert 
sind, die Selektionsverzerrung zu beseitigen und damit die exakte Identi- 
fikation der Effekte von Maßnahmen zu ermöglichen.” Die Teilnahme an 
einer Qualifizierungsmaßnahme wird simultan mit der Ergebnisvariablen 
bestimmt.” Dabei wird die Teilnahmegleichung entweder parametrisch 
oder nichtparametrisch spezifiziert.” Ein anderer Ansatz besteht darin, 
den Maßnahmeneffekt im Rahmen von Instrumentalvariablenansätzen” 
durch Verwenden von Ausschlussrestriktionen zu ermitteln.” Diesem An- 
satz ist die zweite Gruppe der Annahmen von Manski zuzuordnen, die 
Ausschlussrestriktionen in Verbindung mit Funktionsformrestriktionen 
verwendet. In der Evaluationsliteratur werden zunehmend lokale Instru- 
mentalvariablenschätzer verwendet, um die bereits erwähnten "Local 
Average Treatment Effects (LATE)" zu schätzen. Sie haben den Vorteil, 
im Vergleich zu den parametrischen Modellen weniger Annahmen zu er- 
fordern und deswegen robustere Ergebnisse zu liefern. Da diese "Local 
Average Treatment Effects" sich jedoch immer nur auf spezielle Gruppen 
beziehen, z.B. die Personen, die durch eine Änderung der Instrumentalva- 
riablen zur Teilnahme bewogen werden, sind die Ergebnisse somit nicht 
auf die Grundgesamtheit übertragbar. Deshalb werden diese Modelle im 
Folgenden nicht weiter theoretisch betrachtet. 


(5) Strukturelle Simulationsmodelle: Diese Modelle sind eng verbunden 


48 
49 


5 
5 


= © 


52 
5 


U 


mit den Selektionsmodellen und werden zum Beispiel im Rahmen der 
Analyse des Arbeitsangebotsverhaltens von Frauen eingesetzt. Sie er- 
möglichen zusätzlich zu der Berücksichtigung der Partizipationsentschei- 


Vgl. Heckman/Vytlacil (1999). 


Dies wird auch als Verwenden einer Ausschlussrestriktion bezeichnet, vgl. Manski (1995), 
S. 37. Im Prinzip werden durch diese Selektionsmodelle auch nichtbeobachtbare 
Charakteristika berücksichtigt, jedoch nicht immer in ausreichendem Maße, vgl. 
Fitzenberger/Prey (1998), S. 51. 

Vgl. Heckman/Hotz (1989). 

Vgl. Manski (1994b), S. 156ff. Manski verwendet in seinen Analysen der 
Selektionseffekte ebenfalls Ausschlussrestriktionen. Insofern besteht eine Gemeinsamkeit 
mit den Selektionsmodellen in (4). 

Vgl. Angrist et al. (1996). 

Vgl. Blundell/Costa Dias (2002), S. 2. 
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dung, Präferenzen von Restriktionen zu trennen und werden daher zum 
Beispiel in Modellen verwendet, die Steuerreformen simulieren, bei denen 
Restriktionen verändert werden, die Präferenzen der Frauen jedoch unver- 
ändert bleiben.” 


Der nun folgende Abschnitt 3.2 stellt den Kern des theoretischen Teils dieser 
Arbeit zur Schätzung von Bildungsertragsraten dar. Zuerst wird in Abschnitt 
3.2.1 die Struktur der Lösungsansätze dargestellt. Dann werden nach und nach 
in den Abschnitten 3.2.2 bis 3.2.6 Annahmen eingeführt, mit denen das Intervall 
für die Bildungsrenditen zunehmend verringert werden soll. Jede Annahme wird 
ausführlich hinsichtlich ihrer Eigenschaften und ihrer ökonomischen Bedeutung 
diskutiert. Abschließend wird in Abschnitt 3.2.7 ein systematischer Vergleich 
der verschiedenen Grenzen vorgenommen. 


3.2 Lösungsansätze im Rahmen der Analyse von Bildungsertragsraten 


Welcher Weg soll — oder besser — kann beschritten werden, wenn man nicht ge- 
willt ist, exogene Treatmentselektion (ETS) zur Lösung des Identifikationsprob- 
lems zu verwenden? In Abschnitt 3.2.1 werden die Lösungsansätze, die sich 
aufgrund ihrer Annahmen zur nichtparametrischen Analyse von Bildungser- 
tragsraten eignen, skizziert und in drei Strategien unterteilt. 


Der Strategie folgend, ausreichend schwache Annahmen zu verwenden, um hin- 
reichend glaubwürdig zu sein, wird als Ausgangspunkt in Abschnitt 3.2.2 das so 
genannte Worst-Case-Grenzen gewählt. Bei diesem Lösungsansatz verzichtet 
man vollständig auf Annahmen über die nicht identifizierbaren Größen des in 
(3.8) dargestellten Identifikationsproblems und verwendet ausschließlich anhand 
der Stichprobe identifizierbare Größen. Es wird untersucht, welche Konsequen- 
zen sich daraus für die Identifizierbarkeit der D-Parameter und der D-Treat- 
menteffekte ergeben. Die aus diesem Lösungsansatz resultierenden Grenzen 
werden als Benchmark für die Identifikationskraft der darauf folgenden Ansätze 
verwendet. In Abschnitt 3.2.3 wird angenommen, dass für eine geordnete Menge 
von Treatments die Responsefunktion schwach monoton steigend verläuft, mit 
mehr Bildung also das Einkommen zumindest nicht fallen kann. Bei dieser aus 
der Produktionstheorie entlehnter Annahme monotoner Responsefunktionen, 
"Monotone Treatment Response (MTR)", bleibt der Prozess der Selektion in das 
Treatment vollständig unberücksichtigt. Dieser Selektionsprozess wird in Ab- 


°* Vgl. Blundell/MaCurdy (1999), S. 1672ff. 
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schnitt 3.2.4 aufgegriffen und zur Bestimmung von Grenzen verwendet. Die 
Annahme exogener Treatmentselektion (ETS) wird dabei insoweit abge- 
schwächt, als für Personen, die ein höheres Bildungsniveau wählen, lediglich 
angenommen wird, dass sie im Durchschnitt mindestens so viel verdienen wie 
Personen, die ein niedrigeres Bildungsniveau gewählt haben. Diese Annahme 
wird wegen der Berücksichtigung der Selektion in Bildungsniveaus als "Mono- 
tone Treatment Selection (MTS)" bezeichnet. 


Mit Blick auf die Grundidee der Humankapitaltheorie, dass durch die Investition 
in Bildung Humankapital erworben bzw. produziert wird, und die Anstrengun- 
gen, die unternommen wurden und werden, um Modelle zu konstruieren, die 
Selektionseffekte berücksichtigen, berücksichtigen beide Aspekte zentrale Fra- 
gestellungen der Humankapitaltheorie. Aus diesem Grund werden die beiden 
Annahmen, MTR, für den produktionstheoretischen Aspekt, und MTS stellver- 
tretend für die individuelle Entscheidung, in Abschnitt 3.2.5.3 kombiniert. 


Alle in Abschnitt 3.2 dargestellten Annahmen werden zunächst dahingehend 
untersucht, welche Konsequenzen bzw. Grenzen sich für die D-Parameter erge- 
ben, um mit diesen Grenzen dann Grenzen für die D-Treatmenteffekte an- 
zugeben. 


Neben den hier behandelten gibt es weitere Lösungsansätze, die jedoch im 
Rahmen der hier durchgeführten Analyse von Bildungsertragsraten nicht aus- 
führlich besprochen werden. Der wichtigste Ansatz darunter, "Shifted Outcomes 
with an Exclusion Restriction", unterstellt — in aller Kürze — dass der Unter- 
schied zwischen zwei Treatments exakt, und nicht nur im Durchschnitt, fiir alle 
Personen gleich ist.” Dieser Ansatz wurde beispielsweise bei der Analyse des 
Einflusses der Mitgliedschaft in einer Gewerkschaft auf den Lohnsatz verwen- 
det. Im Zusammenhang mit der Analyse von Bildungsertragsraten erscheint die- 
ser Ansatz als zu restriktiv "7 


Folgendes kleine Zahlenbeispiel in Tabelle 3.1 soll in den kommenden Ab- 
schnitten helfen, die Funktionsweise der Annahmen zu veranschaulichen und 
vor allem die Interpretation der Ergebnisse für die Quantile der Responsefunk- 
tion zu erleichtern, die in der empirischen Forschung in diesem Zusammenhang 


5$ Zur Kritik an dieser Annahme vgl. Manski (1995), S. 44, und Lechner (1999), S. 26. 

° Ein weiterer Ansatz, der meines Wissens aber noch nie empirisch angewandt wurde, 
unterstellt bedingte Symmetrie der Verteilung der Ergebnisvariablen, vgl. Manski (1994b), 
S. 158. Auch diese Annahme erscheint bei der Analyse von Bildungsertragsraten nicht 
plausibel. 
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auf die Schätzung von Bildungsertragsraten noch nie angewandt wurden. Die- 
sem Beispiel liegt eine hypothetische Zufallsstichprobe von 1000 Personen mit 5 
Ausprägungen einer Treatmentvariablen T zugrunde. 


Tabelle 3.1: Hypothetische Verteilung 


5 
2o | 02 | o Ton 1.00 
"al 020 


1000 


3.2.1 Struktur der Lösungsansätze 


Ausgangspunkt der folgenden Überlegungen ist der Treatmenteffekt Atta iN 


der allgemeinen Darstellung des Identifikationsproblems für zwei beliebige 
Treatments t; und t, (t; #t,): 


An, = Eytt wl- Ela il 
(3.18) = E[y(t,)|w,z = t, ]- P(z = t,|w) + Ely(t,)|w,z = t, |- P(z = tiw) 
= GË OK = t, |: P(z = t,|w)+ Ely(t, )|w,z = Al P(z = t,|w) 


Es stellt sich die Frage, welche Werte fiir die nicht beobachtbaren bedingten 
Erwartungswerte Ely(t,)|w,z=t,| und Ely(t,)|w,z=t,| verwendet werden 
können bzw. sollen, wenn man nicht gewillt ist, die Annahme von ETS zu tref- 
fen. In Abschnitt 3.2.2 wird, wie schon angedeutet, darauf verzichtet, eine An- 
nahme über die beiden Größen und damit über den Verlauf der Responsefunkti- 
onen zu treffen. Dann gibt es jedoch genau zwei Extremfälle. Die Personen mit 
realisiertem Treatment z=t, können dann bei einem Treatment t, bestenfalls 


das maximale Ergebnis der Verteilung K, oder schlimmstenfalls das minimale 

Ergebnis K,, die Personen mit realisiertem Treatment z=t, entsprechend K, 

oder K, bei dem Treatment t, erwarten. Man könnte auch verschiedene untere 

und obere Schranken K, bzw. K, für die Werte der Treatmentvariablen t, bzw. 
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t, ansetzen. Dies würde allerdings die Darstellung nur unnötig komplizieren.”’ 


In Tabelle 3.2 sind die Kombinationen, die zu der absoluten Unter- bzw. Ober- 
grenze führen, angegeben. 


Tabelle 3.2: Unter- und Obergrenzen der nicht beobachtbaren bedingten Erwar- 
tungswerte im Worst-Case-Fall 


SESCH | siemens 


Setzt man diese Extremwerte in (3.18) ein, erhält man im Unterschied zu der 
Annahme von ETS nun zwei extreme Werte für den Treatmenteffekt T(w), ent- 
weder eine absolute Untergrenze oder eine absolute Obergrenze. Deshalb wer- 
den diese auch Worst-Case-Grenzen genannt. Der Worst-Case-Fall führt zwar 
nicht zur Identifikation des Treatmenteffekts, erlaubt jedoch die Identifikation 
scharfer Grenzen ohne Annahmen treffen zu müssen. 


Welche Annahmen oder Strategien können nun verwendet werden, um diese 
Worst-Case-Grenzen zu verbessern? In Übersicht 3.2 werden zwei verschiedene 
Strategien unterschieden, um die latenten Größen, beispielsweise die nicht be- 
obachtbaren Erwartungswerte Ely(t,)|w,z=t,| und Elytt)w,z=t,], zu 


berücksichtigen. 


Im ersten Fall, der Restriktion der Verteilungsfunktion der Ergebnisvariablen bei 
gegebenem Wert t der Treatmentvariablen, unterstellt man a priori, dass eine 
Variable x mit der Treatmentvariablen hoch und mit der Ergebnisvariablen nicht 
korreliert. Diese Variable ist somit von der Bestimmung des Ergebnisses ausge- 
schlossen, weshalb die Verwendung einer solchen Variablen auch als Aus- 
schlussrestriktion bzw. Level-Set-Restriction” und die Variable selbst als Instru- 
mentalvariable bezeichnet wird (Abschnitt 3.2.4). 


°” Vgl. auch Heckman/Vytlacil (2001a), S. 3, Fußnote 2, und Manski (1994b), S. 147. Ein 
weiterer Grund, warum im Folgenden auf die Verwendung verschiedener Schranken 
verzichtet wird, ist, dass im Verlauf der Arbeit verschiedene Annahmen entwickelt und 
vorgestellt werden, die von diesen Schranken und deren Modellierung nicht abhängen. 

°® Manski definiert Level-Set-Restriktionen als Bedingungen, dass bestimmte Charaktristika 
der bedingten Verteilung P(y|x) für bestimmte X, cX konstant sind. Aus dieser 
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In Abbildung 3.3 ist die Wirkungsweise der Ausschlussrestriktion bzw. der In- 
strumentalvariablen zur Ermittlung der Grenzen für den Erwartungswert ange- 
deutet. Für jede der sieben Ausprägung der Instrumentalvariablen x (x, ..., X7) 
wurde das Intervall für den Erwartungswert bestimmt. Nimmt man nun an, dass 
die Variable x von der Bestimmung des Ergebnisses ausgeschlossen ist, oder mit 
anderen Worten, dass das Ergebnis und damit in diesem Fall der Erwartungswert 
für alle sieben Ausprägungen konstant ist, muss der wahre Erwartungswert in 
allen sieben Intervallen enthalten sein. Deshalb bildet die Schnittmenge der sie- 
ben Intervalle, die Obergrenze bei x3 und die Untergrenze des Intervalls bei xz, 
das Intervall für den Erwartungswert bei Verwendung der Instrumentalvariablen 
(IV). 


Auf die Humankapitaltheorie übertragen bedeutet dies, dass der Erwartungswert 
der Lohnfunktion mit der Bildungsvariablen als Instrument von der Anzahl der 
gewählten Bildungsjahre unabhängig ist. Dies stellt jedoch nichts anderes dar als 
die Annahme exogener Treatmentselektion (ETS), die sich hier als Spezialfall 
des Instrumentalvariablenansatzes ergibt. Dieser allgemein übliche, in Zusam- 
menhang mit der Wahl von Bildungsjahren jedoch durchaus zu kritisierende An- 
satz wird durch die Annahme einer monotonen Instrumentalvariablen insofern 
abgeschwächt, als dass der Erwartungswert der Ergebnisvariablen mit steigen- 
den Werten der Instrumentalvariablen, die nun mindestens ordinalskaliert sein 
muss, nicht fallen, aber steigen kann.” Dieser Fall der monotonen Instrumental- 
variablen (MIV) wird in Abbildung 3.4 illustriert. Bestimmt man hier die Unter- 
grenze des Erwartungswertes bei x4, so werden wegen der Monotonieeigen- 
schaft die Untergrenzen bei xs, Xe, x7 nicht berücksichtigt, da der Erwartungs- 
wert an diesen Stellen nicht kleiner als bei x, bzw. x), X2, und x3 sein kann. Die 
Untergrenze wird demnach als Schnittmenge der Untergrenzen bei x), X2, X3, X4 
bestimmt. Analog ergibt sich die Obergrenze des Erwartungswerts bei x, als 
Schnittmenge der Obergrenzen bei x4, Xs, X6, X7, da der Erwartungswert bei x), 
X2, und x3 wegen der geforderten Monotonie nicht größer sein kann. Das Inter- 


Definition ergibt sich der Instrumentalvariablenansatz als Spezialfall der Level-Set- 
Restriktionen, vgl. Manski (1994b), S. 156f. Heckman/Vytlacil (2001a), S. 2, Fußnote 2, 
dagegen bezeichnen die Level-Set-Restriktionen als eine spezielle Form der 
Instrumentalvariablenbedingung. Imbens (2001) gibt einen umfassenden Überblick über 
neuere Entwicklungen des Gebrauchs solcher Bedingungen zur Schätzung von 
Kausaleffekten. 

Dies bedeutet nicht, dass die Responsefunktion y(t) einen steigenden Verlauf aufweisen 
muss. Die Annahme der monotonen Instrumentalvariablen bezieht sich auf einen 
gegebenen Wert t der Treatmentvariablen. Dies wird in Abschnitt 3.2.4 ausführlicher 
erläutert. 


59 
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vall bei MIN kann nie kleiner sein als bei IV. Wie in den Abbildungen 3.3 und 
3.4 angedeutet, vergrößert es sich normalerweise bei MIV. Die Intervalle auf- 
grund IV und MIV fallen nur dann zusammen, wenn die Unter- und Obergren- 
zen für den Erwartungswert bei gegebenem t schwach monoton fallen. Ein Bei- 
spiel für diesen Fall ist in Abbildung 3.5 dargestellt. Die Intervalle aufgrund 
MIV und im Worst-Case-Fall entsprechen sich im umgekehrten Fall, wenn die 
Unter- und Obergrenzen für den Erwartungswert” bei gegebenem t schwach 
monoton steigen. Während durch die Verwendung der Instrumentalvariablen 
den individuellen Responsefunktionen y Du keine Restriktionen auferlegt wer- 


den (Abschnitt 3.2.4), entlehnt man im zweiten Fall aus der Produktionstheorie 
(Abschnitt 3.2.3) die Annahme, dass der Ertrag y; mit steigendem Input t 


zumindest nicht sinken sollte, d.h. schwach monoton steigt, oder zusätzlich, dass 
die individuelle Responsefunktion y BO konkav verläuft. Diese beiden Fälle 


sind in Abbildung 3.6 dargestellt. 


Übersicht 3.2: Struktur der nichtparametrischen Lösungsansätze 


A priori Informationen 


(1) (2) 
Restriktion der Restriktion der 
Verteilungsfunktionen Responsefunktionen 


Ply(\w] Ply(t}w] 
Ki Kombination 
der 

Restriktionen 

Instrumentalvariablen 
(IV) 
("Level-Set 
Restrictions") 


Eigenschaften der Responsefunktion 


Monotonie, Selektion des 
Semi- Treatments mit dem 
a M Monotonie, | größeren Ergebnis 


Konkavität 
3.2.3 


Abbildung 
3.6 


3.2.4 


Abbildungen 
3.3 und 3.5 


3.2.5 3.2.6 


Abbildungen 
3.4 und 3.5 


°° Genauer gesagt die Worst-Case-Grenzen des Erwartungswertes; vgl. Manski/Pepper 
(2000), S. 1001 und die ausführliche Darstellung in Abschnitt 3.2.4. 
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In Abschnitt 3.2.5 werden dann Verteilungsfunktionen und Responsefunktionen 
gleichzeitig durch die Annahmen aus den Abschnitten 3.2.3 und 3.2.4 restrin- 
giert, um den Erwartungswert und Treatmenteffekt weiter einzugrenzen. 


Auch in Abschnitt 3.2.6 werden die Ergebnisse der Responsefunktion geordnet. 
Analog zu Roy (1951), der die Wahl zwischen zwei Beschäftigungen unter- 
suchte, wird nun angenommen, dass eine Person die Ergebnisse bei verschiede- 
nen Bildungsniveaus anhand der jeweils abdiskontierten zu erwartenden Le- 
benseinkommen ordnet und dasjenige Bildungsniveau wählt, bei dem dieses ab- 
diskontierte Lebenseinkommen am größten ist. 


Abbildung 3.3: Grenzen bei IV Abbildung 3.4: Grenzen bei MIV 


Obergrenze Untergrenze Obergrenze 


Untergrenze 


Abbildung 3.5: Gleichheit der Abbildung 3.6: Monotonie- 
Grenzen bei MIV und IV annahmen 


konkav 


schwach 
monoton 


X X2 X3 X4 X5 X6 X7 
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3.2.2 Annahmenfreie Identifikationsanalyse (Worst-Case-Grenzen) 


Die Grenzen, die man ohne eine Annahme zu treffen erhält, sollen als Bench- 
mark, als Referenzgröße zur Messung der Identifikationskraft der Ansätze in 
den Abschnitten 3.2.3 bis 3.2.6 dienen. So kann für jede dieser Annahmen über- 
prüft werden, inwieweit die Schätzungen z.B. des Treatmenteffekts gegenüber 
diesen Worst-Case-Grenzen, gemessen an den ermittelten Unter- und Obergren- 
zen für den Treatmenteffekt, verbessert werden. 


3.2.2.1 Scharfe Grenzen für D-Parameter 


Verzichtet man völlig auf Annahmen über die in der interessierenden Gesamt- 
heit nichtbeobachtbaren, bedingten D-Parameter Data. # t] und verwendet 


nur empirische Evidenz, d.h. Beobachtungspaare mit z; = t, können Grenzen für 


die unbedingten D-Parameter D[y(t}w] angegeben werden. 


Mit [K,,K,] wird der Wertebereich der Responsefunktion y(-) bezeichnet. Ko 
stellt die größte untere Schranke, das Supremum, K, die kleinste obere 


Schranke, das Infimum, dar. Dann gelten im Worst-Case-Szenario unter aus- 
schließlicher Verwendung empirischer Evidenz die folgenden scharfen Grenzen 
für die individuelle Responsefunktion y;(t), jeJ, rel: 


z,#t> Ky sy,(t)<K, 


3.19 
l ) Z,=t> yj) =yj 


Bezeichnet man mit yọ Jl die scharfe Unter- und mit y, Du die scharfe Ober- 
grenze der individuellen Responsefunktion y dE kann man (3.19) darstellen als: 


SCH Yoj) S y(t) Sy, ;(t) ‚mit 
3210) Yo) "plan 
| := Ky sonst i 


y,;(t) =y falls z,=t 
a := K; sonst 
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Einem Individuum j wird somit bei der Bestimmung seiner Responsefunktion 
als Untergrenze K, und als Obergrenze K, zugeteilt, falls das realisierte Treat- 
ment z; dieses Individuums nicht dem betrachteten Treatment t entspricht, also 
z;+t ist. Das realisierte, beobachtbare Ergebnis des Individuums y; wird 
verwendet, falls es dem betrachteten Treatment t entspricht, also z,=t ist. 
Aggregiert man die individuellen Responsefunktionen, können mit deren schar- 
fen Grenzen (3.19) bzw. (3.20) scharfe Grenzen für die D-Parameter der interes- 
sierenden Verteilung bestimmt werden: 


3.22) Dhow] Diels Giel vteT 


Dies bedeutet, dass entsprechend der Vorgehensweise bei den individuellen 
Responsefunktionen zur Bestimmung 


— der Untergrenze für einen D-Parameter Dly(t)w] allen Beobachtungs- 
paaren mit z; #t das Supremum Ko, allen Beobachtungspaaren mit z; =t 


das realisierte Ergebnis y; 


— der Obergrenze für einen D-Parameter Dal allen Beobachtungspaaren 
mit z; #t das Infimum K,, allen Beobachtungspaaren mit z; =t das reali- 


sierte Ergebnis y; 


zugeordnet wird. 


Mit (3.19) bzw. (3.20) können nun scharfe Grenzen für die Durchschnittsfunk- 
tion Ely(t}w] bestimmt werden.” Nach dem Satz von der totalen Wahrschein- 


lichkeit lässt sich Ely(t}w] schreiben als: 
(3.23) ` Ely(t)w]= E(y|w,z = t): P(z = tlw) + Ely|w,z = t): P(z tlw) . 


°° Diese Worst-Case-Grenzen waren bereits 1954 bekannt, wurden aber wegen der geringen 
Identifikationskraft nicht weiter verwendet. Vgl. Manski (1995), S. 30: "Cochran, 
Mosteller and Tukey (1954, S. 274-282) used bounds of the form ... to express the possible 
effects of nonresponse to the Kinsey survey. Unfortunately, the subsequent literature did 
not pursue the idea." Manski zitiert Cochran (1977) "The limits are distressingly wide ..." 
und folgert "Cochran appears not to have recognized the value of worst-case bounds in 
establishing a domain of consensus among researchers." 
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W,Z# t) können alle Größen anhand der Stich- 
probe identifiziert werden. Der bedingte Erwartungswert E(ylw, z# t) kann aber 
nach (3.19) jeden Wert aus [K,,K,]| annehmen, so dass die folgenden scharfen 
Grenzen für den unbedingten Erwartungswert Ely(t)w] gelten: 


Bis auf den Erwartungswert E(y 


Ko: P(z d t|w)+ E(y W,Z= t). P(z = tlw) 
E y(t)w 
K; Plz # t\w)+ E(ylw,z = t)- P(z = tw) 


(3.24) 


IA IA 


Diese Worst-Case-Grenzen werden auch als "no-assumptions-bounds" bezeich- 
net, da Information fur die Unter- und Obergrenze von Ely(t)w] nur aus den 


Beobachtungswerten mit zj =t gezogen wird und auf jedwede Annahme über 
die Beobachtungspaare mit z; #t verzichtet wird. 


Bei der Bestimmung der Worst-Case-Grenzen für die Quantile der Response- 
funktion, qaly(t)w], müssen Fallunterscheidungen‘' getroffen werden, da sich 


je nach den Werten von a und P(z = tlw) Unterschiede im Informationsgehalt 


der Unter- und Obergrenze ergeben können. So kann es zum Beispiel sein, dass 
sich für ein gegebenes o die Untergrenze für qaly(t)w] für P(z + tlw) > a nicht 
vom Supremum K, unterscheidet, da in diesem Fall der Anteil der 
Beobachtungswerte mit z +t, denen K, zugeordnet wird, größer ist als a, 
gleichzeitig jedoch die Obergrenze für o. alle) informativ, d.h. vom Infimum 
K, verschieden ist, wie folgende Fallunterscheidungen zeigen: 


Übersicht 3.3: Informative und nichtinformative Bereiche der Quantilfunktion 


3.25a 0 <a<P(z#t)> Ko <q,ly(t 

3.25b Plz=t)<a< 1 > q.lyit)|s Lë 
3.250) P(z#t)<a< 1 =4,,(yz=t)<q,ly(t)] 

3.25d 0 <a<P(z=t)> aaly(t)]< q, (yz =t) 


3.25e) Plz=t)<a<sP(z#t)> K, ~ <q,ly(t)l< K, 
3.25f ae 


61 Vgl. Manski (1994b), S. 149ff. 
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Demnach gibt es genau einen Bereich, (3.25f), in dem Unter- und Obergrenze 
für ein gegebenes Quantil informativ, d.h. von K, bzw. K, verschieden sind 
und genau einen Bereich, (3.25e), in dem weder Unter- noch Obergrenze für ein 
gegebenes Quantil informativ sind. Die Bereiche (3.25a) — (3.25f) sind wie folgt 
zu interpretieren: 


(3.25a) 


(3.25b) 


(3.25c) 


(3.25d) 


(3.25e) 


(3.25f) 


Die Untergrenze für SEO CN ist nichtinformativ, d.h. nicht von K, 
verschieden, falls a< P(z = tw), da in diesem Fall der Anteil der 
Personen, denen K, zugeordnet wird, größer als o ist. 

Die Obergrenze für SE OG EN ist nichtinformativ, d.h. nicht von K, 
verschieden, falls a > P(z = tlw) bzw. l-a < P(z z tw), da in diesem 
Fall der Anteil der Personen, denen K, zugeordnet wird, größer als 
l-a ist. 

Die Untergrenze für q,[y(t}w] ist informativ, d.h. von K, verschie- 
den, falls o > P(z # tlw), da in diesem Fall o — P(z + der) Prozent der 
realisierten Werte von y; der Personen mit z=t verwendet werden 
können. 

Die Obergrenze für qaly(t)w] ist informativ, d.h. von K, verschie- 
den, falls oz P(z = del, da in diesem Fall weniger Personen K, 


zugeordnet wird, als zur Bestimmung des Quantils erforderlich ist. 
Der gemeinsame nichtinformative Bereich K, <q, [y(t }w] <K, 


ergibt sich somit für P(z = t|w)< a < P(z = del 

Der gemeinsame informative Bereich ergibt sich somit für 
P(z # tlw) < as P(z = tw), da dann gleichzeitig der Anteil der 
Personen mit P(z # tlw) klein genug und der Anteil der Personen mit 
P( = tiw) groß genug ist, um realisierte Ergebnisse verwenden zu 
können. 


Dabei wird in (3.25c,f) die Untergrenze des Quantils qa, mit 


(3.26) 


a — P(z # tlw) 
i hd, 
P(z = del 
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und in (3.25d,f) die Obergrenze des Quantils qa, ermittelt mit 


Q 


3.27 A, = — . 
SC ar 


Für ein gegebenes a gilt somit für jedes te T wegen P(z # tw)> 0 immer, 
dass die Obergrenze mindestens so groß wie die Untergrenze ist: 


a — P(z = tlw) o 


EES ee een, x 


(3.29) q,,(ylw.z=t)<q, (y|w,z=t) . 


(3.28) 


3.2.2.2 Informative Bereiche 


Zur grafischen Darstellung dieser Fälle anhand des Einführungsbeispiels wird 
das Treatment t=11, K,=0, K,=100 und aus Darstellungsgründen eine 


stetige Rechteckverteilung in [10 , 90] für die bedingte Verteilung P(ylw,z =l 1) 


gewählt. Die Quantilfunktion dieser stetigen Rechteckverteilung ist 
x(F)=80-F +10. Mit P(z=1 wi = 0,3 erhält man Tabelle 3.3a und Abbildung 


3.7, für den Fall, dass es keinen gemeinsamen informativen Bereich gibt. 


Tabelle 3.3a: Quantilfunktion, Worst-Case-Grenzen, P(z = 1 Iw) = 0,3 


| BE, Untergrenze der Obergrenze der 
Bereiche Quantilfunktion Quantilfunktion 


P(z=11lw) =0,3 Ky =0 
<a < P(z #1]|w)= = 0,7 
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Abbildung 3.7: Bereiche der Quantilfunktionen, Worst-Case-Grenzen, 
P(z = 11|w) = 0,3 


100 
90 
gemeinsamer nicht- 
informativer Bereich 
10 
0 
0 1 3 5 7 9 1 
108 


Wählt man nun anstelle von P(z=11|w)=0,3 P(z =11|w) =0,7, erhält man 


Tabelle 3.3b und Abbildung 3.8 für den Fall, dass es einen gemeinsamen 
informativen Bereich gibt. 


Tabelle 3.3b: Quantilfunktion, Worst-Case-Grenzen, P(z = tw) =0,7 
Untergrenze der Obergrenze der 


P(z # 11jw)= 0,3 - 

m MP) =80:- 0 glo 
<a <Plz=11lw)= 0,7 0, 0,7 
P(lz=11w)=0,7<a<ı | x(F)=80- m +10 Kı =100 
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Abbildung 3.8: Bereiche der Quantilfunktion, Worst-Case-Grenzen, 
Pi2= tlw) =0,7 


100 


gemeinsamer infor- 
mativer Bereich 


90 


Wie viel Prozent der Beobachtungswerte mit z =t müssen nun bei der Bestim- 
mung der Unter- und Obergrenze jeweils verwendet werden? Bei der Bestim- 
mung der Untergrenze des a-Quantils wird für die Beobachtungswerte mit 
z#t nach (3.25a) das Supremum K, angenommen. Falls a> P(z # tw), das 
a-Quantil informativ ist, müssen noch insgesamt a-Plz = tiw) Prozent aus 
den Beobachtungswerten mit z =t bestimmt werden, deren Anteil P(z = tlw) 
beträgt. Dies entspricht aber dem A ,-Quantil der auf z = t bedingten Verteilung 
von y, wobei das A,-Quantil dann mit à, = a — P(z + tw )/P(z = t|w) bestimmt 
wird. Bei der Bestimmung der Obergrenze des a-Quantils qaly(t)w] müssen 
dann, falls a < P(z = tlw), a Prozent über die auf z = t bedingte Verteilung von 
y bestimmt werden. Dies entspricht der Bestimmung des A,-Quantils 
qa, (ylw,z = t) mit A, =a/P(z = tlw). 


Erwartungswert und Quantile der Responsefunktion unterscheiden sich somit 
deutlich in Bezug auf die Identifikation der Unter- und Obergrenze. Die Unter- 
und Obergrenze der Responsefunktion fiir den Erwartungswert GEO DN hängen 


immer von K, bzw. K, und dem bedingten Erwartungswert Elle, = t) ab. 
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Sie unterscheiden sich damit von K, bzw. K,, da E( = ) normalerweise 


von K, bzw. K, verschieden und P(z = tw) normalerweise ungleich Null ist. 


Sp Gegensatz eth gibt es bei den Quantilen den Bereich 
z=tiw)<a< P( Z + tlw), in dem sich sowohl die Unter- als auch die Ober- 


grenze für aaly(t}w] nicht von K, bzw. K, unterscheiden, d.h. nur tiber die 


latenten Realisationen mit z#t bestimmt sind, und den Bereich 
P(z = tlw)< a< P(z = tlw), in dem Unter- und Obergrenze gemeinsam infor- 


mativ sind, d.h. mit Hilfe der empirischen Evidenz bestimmt werden. Dieser 
Unterschied zwischen Erwartungswert und den Quantilen wird sich auch bei den 
nächsten Annahmen — wenn auch nicht in gleichem Ausmaß — zeigen. In Ab- 
schnitt 3.3 wird gezeigt, dass sich diese unterschiedliche Eigenschaft im Rah- 
men der so genannten Analyse von Bruchpunkten robuster Verfahren gut inter- 
pretieren lässt. Horowitz/Manski (1995)® führen in Zusammenhang mit Daten- 
fehlermodellen das Konzept des Identifikationsbruchpunkts ("identification 
breakdown point") ein. Der Bruchpunkt ist bei den robusten Verfahren SE 
als der größtmögliche Anteil korrupter Daten, der auftreten darf, ohne ' 
große Auswirkungen auf die Schätzfunktion zu haben.” Dem folgend, Ven 
die Größen P(z # tlw) und P(z = tw) in den Fallunterscheidungen (3.25a) - 


(3.25f) als Bruchpunkte interpretiert werden, ab denen die Schätzfunktion die 
größte untere Schranke bzw. die kleinste obere Schranke annimmt. In Abschnitt 
3.3 wird ausführlich auf dieses Konzept des Identifikationsbruchpunkts einge- 
gangen. 


3.2.2.3 Scharfe Grenzen für D-Treatmenteffekte 


Nachdem Unter- und Obergrenzen für die D-Parameter bestimmt sind, können 
Punktschätzungen für Unter- und Obergrenze von D-Treatmenteffekten beliebi- 
ger Treatments t, und t,, t, #t,, ermittelt werden. Dabei sind die beiden Ef- 


fekte (3.30) und (3.31) zu unterscheiden, die im Fall des Erwartungswertes, 
(3.32), identisch sind. 


(3.30) | AD-Treatmenteffekte: Datt, Jw] = Diy(t, Jw] : 


°2 Vgl. Horowitz/Manski (1995), S. 286. 
6° Vgl. Hampel et al. (1986), S. 12. 
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(3.31) ` DA-Treatmenteffekte:  Dly(t,)-y(t,)] , 
(3.32) AE, EA -Treatmenteffekt: E[y(t, )]- Ely(t, )]=E[y(t,)- y(t,)] 


Beide Varianten sind in der Literatur zur Analyse des Medians vertreten. Cle- 
ments et al. (1994) analysieren DA -Treatmenteffekte, während Manski (1994b) 
als AD-Treatmenteffekt den Median untersucht. 


Die in Abschnitt 3.2.2.1 ermittelten scharfen Grenzen für D-Parameter können 
nun verwendet werden, um scharfe Unter- und Obergrenzen für D-Treatmentef- 
fekte zu ermitteln. Bis auf den Fall konkav-monotoner Responsefunktionen, der 
in Abschnitt 3.2.3.3 behandelt wird, ergibt sich die Obergrenze des D-Treat- 
menteffekts in Übereinstimmung mit den jeweils verwendeten Annahmen un- 
mittelbar durch Konstruktion des maximalen Unterschieds zwischen den D-Pa- 
rametern zweier beliebiger Treatments t, #t,. Das Maximum ergibt sich in die- 
sem Fall jedoch einfach, falls D[y(t,)] kleiner als D[y(t,)] ( Dly(t, )] größer als 
D{y(t,)]) ist, als Differenz der Obergrenze von D[y(t,)] ( D[y(t,)]) und der 


Untergrenze von Dit, ( Dit. )] ). 


Die Obergrenze des durchschnittlichen Treatmenteffekts in (3.32) ergibt sich 
dann mit Ely(t,)]< Ely(t,)] (Ely(t,)|> Ely(t,)]) nach (3.33) als Differenz der 


Obergrenze des Erwartungswerts in (3.24) fir t, DN und der Untergrenze des 
Erwartungswerts in (3.24) für t, (t, ). 


Im Worst-Case-Szenario ist die Untergrenze im Unterschied zu den meisten der 
noch folgenden Annahmen nicht durch 0 begrenzt und ergibt sich nach (3.33) 
mit Ely(t,)]< Ely(t,)] ( Ely(t,)]> Ely(t,)] ) als Differenz der Obergrenze von 


Ely(t, H und der Untergrenze von Elyft, )]: 
E(yz=t,)P(z=t,)+K,-P(z#t,)- Elyz=t,)P(z=t,)-K,-P(z#t,) 
(3.33) < Ely(t,)|- bio, 
Elvis =t, )-P(z =t,)+K, -P(z = t,)- Elylz =t,)-P(z=t,)-K,-P(z#t,) 


Bildet man die Differenz der Obergrenze und der Untergrenze des durchschnitt- 
lichen Treatmenteffekts, erhält man die maximale Breite: 


3.34) (Kı-K,)-[Plz#t,|w)+Plz#tw)] . 
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Interessant ist der Vergleich dieser maximalen Intervallbreite des Worst-Case- 
Szenarios mit der maximalen Intervallbreite, die sich ergibt, wenn man auf jeg- 
liche empirische Evidenz“ verzichtet. In diesem Fall unterscheiden sich die 
scharfen Grenzen der D-Parameter bei den Treatments t, und t, nicht von K, 


bzw. K, und es ergibt sich als Intervall für den ATE E[y(t, )]- Ely(t, )]: 
(3.35) [K)-K,,K,-K,]® . 


Die maximale Intervallbreite beträgt somit 2-(K,-K,), und entspricht der 


zweifachen Spannweite, da weder empirische Evidenz noch Annahmen über die 
Responsefunktionen verwendet wurden. Dieses Intervall wird allein durch die 
empirische Evidenz immerhin insoweit verbessert“ als mit (3.34) gilt: 


336)  (K,-—K,):-[P(z#t,)+P(z¥t,)|<2-(K,-K,) . 


Fiir den Fall, dass die Treatmentvariable exakt zwei Werte annimmt, gilt jedoch 
in (3.34) [P(z#t,)+P(z#t,)|=1%, und im Fall mehrerer Werte der 


Treatmentvariablen [P(z#t,)+P(z#t,)]21, so dass das Intervall in dem der 
Treatmenteffekt liegt nicht kleiner als (K, — Kọ) sein kann: 


(3.37) (Ki -K,)-[P(@z#t,)+P(z #t,)]2 (K, - Ko) . 


Damit ergibt sich eine Besonderheit im Fall des Worst-Case-Szenarios. Wenn 
die maximale Intervallbreite mindestens (K, — K, ) beträgt, kann das Vorzeichen 


des Treatmenteffekts allein aufgrund der empirischen Evidenz nicht identifiziert 
werden, da die Untergrenze des Treatmenteffekts notwendigerweise immer ne- 
gativ und die Obergrenze immer positiv sein muss. 


Dies spiegelt sich auch in den Grenzen des Treatmenteffekts wider. Dazu wird 
untersucht, welche Werte die Untergrenze 


6* Vgl. Manski (2000a), S. 429. 

65 Für binäre Variablen ist Ko=0 und K;=1 und deshalb die maximale Intervallbreite 
2(Ki-Ko)=2 ohne Berücksichtigung und P(z=t,)+P(z=t2)=1 mit Berücksichtigung 
empirischer Evidenz; vgl. Manski/Nagin (1998), S. 113. Also ist auch hier das Vorzeichen 
des Treatmenteffekts mit empirischer Evidenz allein nicht identifizierbar. 

Die scharfe untere (obere) Grenze ist die untere (obere) Grenze von E[y(t2)|x] minus die 
obere (untere) Grenze von on S Manski (2000a), S. 430, und Abschnitt 3.2.2. 


p(z + to|w)+ P(z 4 ty|w) = fı- P |+ fi - Plz = ty|w)| = 2- [P(z = tz|w)+ p(z = ty|w)] = ] 
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54 
(3.38) Elylz=t,)-P(z=t,)+K,-P(z#t,)- Elylz=t,)-P(z=t,)-K,-P(z#t,) 


maximal bzw. minimal annehmen kann. Man ersetzt Elle = t,) und Elle = ti) 
einmal durch K, bzw. K, und dann durch K, bzw. K,. Im ersten Fall erhält 
man für die Untergrenze in (3.38) 


(3.39) (K, -K,)-[P(z=t,)+P(z=t,)—1]<0 

Im zweiten Fall erhält man 

(3.40) K,-P(z=t,)+K,-P(z¥t,)—K, -P(z=t,)—K, -P(z#t,)=(K, -K,) 
Die Untergrenze des Treatmenteffekts liegt demnach im Intervall 

(3.41) [(K,—K,),(K,-K,):-(P(z=t,)+P(z=t,)-1)] . 

Die Obergrenze des Treatmenteffekts liegt dann im Intervall 

(3.42) [K -K,)-[1-P(z=t,)-—P(z=t,)], (K, -K,)] . 


Da die Untergrenze des Treatmenteffekts in (3.41) nie größer Null und die 
Obergrenze in (3.42) nie kleiner Null werden kann, kann mit den Worst-Case- 
Grenzen allein nicht ermittelt werden, welches Treatment das größere durch- 
schnittliche Ergebnis Hefter P 


Bei den Quantilen müssen die AD- und DA -Treatmenteffekte einzeln betrachtet 
werden. Für den Aq -Treatmenteffekt ergibt sich als Intervall ohne Verwendung 
empirischer Evidenz offensichtlich ebenfalls [K,—K,,K,—K,]. Dieses 
Intervall wird nun nicht in jedem Fall durch die Worst-Case-Grenzen 
verkleinert. Ist weder die Unter- bzw. Obergrenze von q,[ylt,)] bzw. q,[y(t,)] 
informativ (z.B. Bereich (3.25e) in Übersicht 3.3), ergibt sich keine 
Verbesserung. Im "Optimalfall" sind beide Grenzen für t, und t, informativ 
und man erhält für ein gegebenes o das Intervall: 


3.43) beta Wz=t)a, (yz=t,)-4,Wle=t)] 


6® Vgl. Manski (2000), S. 430, und Lechner (1999), S. 11. 
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55 
wobei A, und A, wieder bestimmt werden als 


(3.44) %,=|a-Plzzt,)/P(z=t,) , 
(3.45) A,=a/Plz=tj|w) i=12. 


Während der durchschnittliche Treatmenteffekt immer von K, und K, abhängt 


und sein Vorzeichen nicht identifiziert werden kann, gibt es bei dem Quantil- 
Treatmenteffekt nun die Möglichkeit, dass für ein gegebenes a die betrachteten 
Treatments t, und t, im jeweils für die Unter- und Obergrenze gemeinsamen 


informativen Bereich P(z#t)<a<P(z=t) liegen, und damit auch der 
Treatmenteffekt nicht von K, bzw. K, abhängt. Die maximale Intervallbreite 
muss dann nicht mindestens (K,—K,) betragen, die Untergrenze des 


Treatmenteffekts muss nicht notwendigerweise negativ sein und das Vorzeichen 
kann dann identifiziert werden, da 


3.46) q,(ylz=t,)-q, (ylz=t,)>0 
(3.47) 4,(ylz=t,)-q (yiz=t)>0 


im Gegensatz zum durchschnittlichen Treatmenteffekt nicht ausgeschlossen 
werden kann. Für den qA-Treatmenteffekt q,[y(t,)- y(t,)] erhält man für ein 


gegebenes a folgende Grenzen: 


(3.48) E? (t, )- yı (t; )] S qa [y(t, )- y(t, ) £4. Ly, (t; )- Yo (t, )] » 


mit yo(t;) als Untergrenze und y,(t,) als Obergrenze, d.h. als maximal 
mögliche Bandbreite wieder 2(K, -K,). Wie beim Aq-Treatmenteffekt ist es 


nicht auszuschließen, dass das Vorzeichen identifiziert werden kann, da wieder 
im Gegensatz zum durchschnittlichen Treatmenteffekt für ein gegebenes a 


(3.49) ` qalyo(t,)—y,(t,Jw]>0 
(3.50) — qaly,(t,)—yo(t, }w] >0 


gleichzeitig möglich ist. 
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3.2.3 Restriktion der Responsefunktion 


Angesichts des produktionstheoretischen Aspekts der Humankapitaltheorie liegt 
es nahe, die annahmefreien Worst-Case-Grenzen durch Annahmen Ober den 
Verlauf der individuellen Lohnfunktion in Abhängigkeit beispielsweise der Bil- 
dungsvariablen zu verbessern. Bei all diesen Annahmen werden wie in Ab- 
schnitt 3.2.2 Restriktionen auferlegt, denen jede individuelle Responsefunktion 
für sich genügen muss. Durch dieses Vermeiden von Restriktionen zwischen 
individuellen Responsefunktionen können diese wieder einfach aggregiert wer- 
den, um zu der Verteilung der Ergebnisvariablen in Abhängigkeit von der 
Treatmentvariablen zu kommen. 


Zunächst wird in Abschnitt 3.2.3.1 die plausible Annahme schwach monoton 
steigender individueller Responsefunktionen (MTR) eingeführt, mit der gefor- 
dert wird, dass bei einer größeren als der von der Person tatsächlich realisierten 
Anzahl an Bildungsjahren der Lohn dieser Person nicht kleiner sein kann. 


In Abschnitt 3.2.3.2 wird die Analyse dann insoweit erweitert, als nicht nur eine 
Treatmentvariable allein, sondern ein Vektor von Treatmentvariablen zugelassen 
wird. Dies bietet beispielsweise die Möglichkeit, entsprechend der in Kapitel 2 
eingeführten Mincerschen Standardlohnfunktion die Variable Berufserfahrung 
zusätzlich zu der Bildungsvariablen in die individuelle Responsefunktion aufzu- 
nehmen. Wie sich zeigen wird, resultiert dies jedoch gegenüber der Annahme 
schwach monoton steigender Responsefunktionen (MTR) in einer Ab- 
schwächung der Identifikationskraft, da schon bei zwei Treatmentvariablen 
nicht mehr alle Paare von Treatments geordnet und damit vergleichbar sind. 
Man spricht deshalb von semi-monotonen Responsefunktionen (SMTR). Bei- 
spielsweise können die Treatmentpaare 10 Jahre Schulbildung, 20 Jahre Berufs- 
erfahrung und 12 Jahre Schulbildung, 15 Jahre Berufserfahrung nicht geordnet 
werden, weshalb für diese ungeordnete Paare je nach Situation die Extremwerte 
K, bzw. K, anstelle der realisierten Größen verwendet werden müssen, also ein 


Informationsverlust auftritt, der zu breiteren Intervallen führt. 


Dagegen wird in Abschnitt 3.2.3.3 die Identifikationskraft erhöht, indem wieder 
nur eine Treatmentvariable in der Responsefunktion zugelassen und die Res- 
ponsefunktion durch die Forderung, dass mit steigendem Input der zusätzliche 
Ertrag abnimmt, stärker eingeschränkt wird. Diese Spezifikation ermöglicht bei- 
spielsweise einen direkten Vergleich der Ergebnisse mit der Verwendung der 
Variablen Berufserfahrung und quadrierten Berufserfahrung in der Standard- 
lohnfunktion. 
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3.2.3.1 Monotone Responsefunktionen (MTR) 


Im folgenden Abschnitt wird untersucht, welche Identifikationskraft die fol- 
gende den Produktionsaspekt der Humankapitaltheorie berücksichtigende An- 
nahme besitzt: 


T sei eine geordnete Menge von Treatments t und die Responsefunktion y(-) 
eine schwach monoton steigende Funktion auf T.” 


Im Unterschied zu den Worst-Case-Grenzen in Abschnitt 3.2.2 werden damit 
zwei Forderungen aufgestellt. Erstens muss die Menge der Treatments nun ge- 
ordnet sein. Zweitens wird mit der Monotonie der Responsefunktionen eine An- 
nahme eingeführt, die latente und realisierte Ergebnisse miteinander verknüpft. 
Damit muss nun im Unterschied zum Worst-Case-Szenario bei der Bestimmung 
der Untergrenze der D-Parameter einer Person bei einem größeren als dem 
realisierten Treatment nicht mehr die untere Grenze K, verwendet werden und 


die Intervallbreite verringert sich. 


3.2.3.1.1 Scharfe Grenzen für D-Parameter 


Formal lässt sich die Annahme schwach” monoton steigender individueller Res- 
ponsefunktionen y,(-) schreiben als" 


(3.51) t,<t,> y(t) <y,(t) für alle jeJ, teT . 
Für die individuelle Responsefunktion y ;(-) folgen die scharfen Grenzen: 


z,<t>y,<sy;(t)<sK, 
(3.52) z,=-t> vil 
z,>t>K, <y;(t) <y; 


6 In Manski (1994b) und Manski (1995) wurde anstelle "monotone response" noch der 
Begriff "ordered outcomes" verwendet. Das Konzept der Responsefunktionen wurde 
erstmalig in Manski (1997a) verwendet. 

TT Der Zusatz "schwach" wird im Weiteren weggelassen, da stets der Fall schwach 
monotoner Responsefunktionen behandelt wird. 

7! Die Ergebnisse lassen sich auf schwach monoton fallende Responsefunktionen 
entsprechend übertragen. 
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Bezeichnet man mit yoj (t) wieder die scharfe Unter- und mit y, Jo wieder die 
scharfe Obergrenze der individuellen Responsefunktion y i6, kann man das 
Intervall für y Du darstellen als: 


(3.53) yoj(t)<y;(t)<y,,(t), mit 


Yoj(t) zg fallsz,st 


.54 
ES := K, sonst 


:= y; fallsz;2t 


yıj(t) 
ES := K, sonst 


Die Untergrenze der individuellen Responsefunktion y(t) wird von y;(t) und 
y;(t) wird von der Obergrenze der individuellen Responsefunktion y,(t) 
dominiert. 


Da es keine Restriktionen zwischen den Individuen gibt, können die individu- 
ellen Responsefunktionen aggregiert werden und die Dominanzrelationen über- 
tragen sich auf die D-Parameter, so dass Dilyw] die Untergrenze Diy Ow] 


dominiert und selbst von der Obergrenze Diy, GË dominiert wird: 


(3.55) ` D[y,(t)|w]< Diy(t)|w]< Diy, ow] 


Auf die Humankapitaltheorie angewandt, ist die Annahme von MTR wie folgt 
zu interpretieren: 


Zur Bestimmung der größtmöglichen unteren Schranke der individuellen Lohn- 
funktion wird für eine gegebene Anzahl an Bildungsjahren t 


e allen Personen, die weniger als t Jahre in Bildung investiert haben, 
ihr realisierter Lohn y; zugeordnet, da sie wegen der Monotonie- 


annahme zumindest nicht weniger verdienen können, 


e allen Personen, die exakt t Jahre investiert haben, 
ihr realisierter Lohn y; zugeordnet, 
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e allen Personen, die mehr als t Jahre investiert haben, 
der minimale Lohn K, zugeordnet, da mit der Annahme der Mono- 


tonie nichts darüber ausgesagt werden kann, wie viel weniger sie 
verdienen wiirden, wenn sie weniger Jahre investiert hatten. 


Zur Bestimmung der kleinstmöglichen oberen Schranke der individuellen Lohn- 
funktion wird für eine gegebene Anzahl an Bildungsjahren t 


e allen Personen, die mehr als t Jahre in Bildung investiert haben, 
ihr realisierter Lohn y, zugeordnet, da sie bei einer Investition von 


weniger Jahren annahmegemäß nicht mehr verdienen können, 


e allen Personen, die exakt t Jahre in Bildung investiert haben, 
ihr realisierter Lohn y, zugeordnet, 


e allen Personen, die weniger als t Jahre investiert haben, 
der maximale Lohn K, zugeordnet, da aufgrund der Monotonie- 


annahme nichts darüber ausgesagt werden kann, wie viel sie mehr 
verdienen würden, wenn sie mehr Zeit investiert hätten. 


Wie wirkt sich nun die Annahme von MTR auf die Grenzen der D-Parameter 
aus? Können diese Grenzen gegenüber den Worst-Case-Grenzen verbessert 
werden? Gibt es auch in diesem Fall prinzipielle Unterschiede zwischen den 
Eigenschaften der Grenzen für den Erwartungswert und für die Quantile? 


Die Analyse beginnt mit den Grenzen für den Erwartungswert Ely(t)|w]. Wie in 


(3.53) und (3.54) gezeigt wurde, zieht die Annahme von MTR für die Unter- 
grenze Information aus den realisierten Beobachtungen der Individuen, die 
höchstens t Bildungsjahre, und für die Obergrenze aus den realisierten Beo- 
bachtungen der Individuen, für die mindestens t Bildungsjahre realisiert haben. 


Ersetzt man in der Darstellung E|y(t)]= E(ylz=t)-P(z=t)+ E(ylz#t)-P(z#t) 

des unbedingten Erwartungswertes nun die latente nicht beobachtbare Größe 
Elle, + t) entsprechend (3.53), ergibt sich die Untergrenze (Obergrenze) für 
Ely(t)|w] als gewogenes arithmetisches Mittel der größten unteren Schranke 
(Supremum) Kg (kleinsten oberen Schranke (Infimum) K,), gewichtet mit dem 


Anteil der Personen, die mehr (weniger) als t Jahre investiert haben, und dem 
Erwartungswert E(y W,ZS t) (Eiylw,z > t)), gewichtet mit dem Anteil der Per- 
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sonen, die höchstens (mindestens) t Bildungsjahre investiert haben. Damit gelten 
für den Erwartungswert Ely(t)|w die scharfen Grenzen”: 


Elylw,z < t): P(z < tlw)+K, - P(z> tlw) 
SÉ 
K, -P(z< t|w)+ Elylw,z > t)- P(z > tw) 


(3.56) 


IA IA 


Wie im Worst-Case-Szenario hängt die Untergrenze in dieser allgemeinen Dar- 
stellung von Ky und die Obergrenze von K, ab. Allerdings ist, wenn man (3.24) 
und (3.56) miteinander vergleicht, direkt ersichtlich, dass der Anteil, mit dem 
K, bzw. K, in die Berechnung der Grenzen eingehen, tendenziell gesunken ist. 
Die Verbesserung ergibt sich daraus, dass bei der Untergrenze (Obergrenze) 
einem geringeren Anteil an Individuen, P(z>tlw) [P(z<t\w)| anstelle von 
P(z + tlw), das Supremum K, (Infimum K,) zugeordnet wird. Deshalb unter- 
scheidet sich die Untergrenze (Obergrenze) tendenziell umso mehr vom Supre- 


mum (Infimum), je "näher" das betrachtete Treatment t am maximalen (mini- 
malen) Treatment t,,,, (tj, ) liegt. 


Im Unterschied zum Worst-Case-Szenario ergeben sich in der Regel deutliche 
Verbesserungen der Grenzen, deren Ausmaß in Abschnitt 3.7 ausführlich unter- 
sucht wird. Des weiteren sind zwei Spezialfälle hervorzuheben: 


1) Für das kleinste Treatment t_. ist der Anteil der Personen, die ein kleineres 


min 
Treatment aufweisen, gleich Null, d.h. P(z < tmin W)=0 und analog 
P(z >t lw)=1. Deshalb vereinfacht sich (3.56) insoweit, als die Ober- 


grenze von Ely(tpin Jw] nicht mehr von K,, sondern nur noch von der 


min 


empirischen Evidenz in Form des Gesamtstichprobenmittelwertes E(ylw) 
abhängt: 


(3.57) Eat (E Elylz 2 Sach P(z 2 tin) = Elylz 2 tmin): Is E(y) ° 


2) Für das größte Treatment t,,,, ist der Anteil der Personen, die ein größeres 


x 


Treatment aufweisen, gleich Null, d.h. P(z>t,„|w)=0 und analog 


” Vgl. Manski (1997a), S. 1318. 
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P(z < tinax |W) = 1. Deshalb vereinfacht sich (3.56) insoweit, als die Unter- 
grenze von Ely(t,... jw] nicht mehr von K,, sondern nur noch von der 
empirischen Evidenz in Form des Gesamtstichprobenmittelwertes E(ylw) 
abhängt: 


wz<t„)1=Elylw) . 


(3.58) Elylw,z<t„.)-Plz<t„.|w)= Ely 


Der Gesamtstichprobenmittelwert E(ylw) stellt somit bei der Annahme von 
MTR die scharfe Untergrenze für das Treatment tax und die scharfe Ober- 
grenze für das Treatment tin dar. Daraus ergibt sich bei der Bestimmung der 
Untergrenze des Treatmenteffekts analog zum Worst-Case-Fall als Untergrenze 
bei "Eug Eli tinax Jw], abzüglich der Obergrenze bei tains Eytan w], ein 
Treatmenteffekt von Null: 


(3.59) Ely(tmae Jwh - Ely ltmin jw], = Elylw)- Ely|w) = 


Dass die Annahme von MTR nicht fiir alle D-Parameter die Grenzen gleicher- 
maßen verbessert, wird wieder bei der Betrachtung der Quantile deutlich. 


Damit die Untergrenze für das Quantil qaly(t)w] bei Annahme von MTR infor- 
mativ sein kann, d.h. von der nicht informativen Untergrenze Kg verschieden 
ist, muss das betrachtete a-Quantil größer sein als die Wahrscheinlichkeit 
P(z > tlw) — im Worst-Case-Fall war die Bedingung a > P(z = do —, da analog 
zu den Grenzen für den Erwartungswert Information aus den Individuen bezo- 
gen wird, deren Investitionen in die Bildung höchstens so groß ist wie die be- 
trachtete Bildungsinvestition (z < t). Da aber Schlussfolgerungen für alle Indivi- 
duen gezogen werden sollen, muss ein ausreichender Anteil an Individuen, 
P(z < tlw)> 1-a , vorhanden sein. 


Ein Beispiel soll dies verdeutlichen: 


Falls bei der hypothetischen Verteilung in Tabelle 3.1 eine informative Unter- 

grenze für das qa [y(10)w]-Quanti1 mit a=0,5, d.h. für den Median der 

Responsefunktion y(10), gesucht wird, kann Information nur aus den 200 

Individuen der Stichprobe mit einer Bildungsdauer von höchstens 10 Jahren 

gezogen werden, da nach der Annahme von MTR für die 800 übrigen Indivi- 
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duen in der Stichprobe mit einer Bildungsdauer größer 10 Jahren der minimale 
Lohn Kg verwendet wird. Für a =0,5 bedeutet dies bei 1000 Personen insge- 


samt, dass die Untergrenze für den Medianlohn dem minimalen Lohn von Kg 
entspricht. Sobald jedoch a > P(z > 10w) ist, z.B. mit a = 0,9, wird wieder 800 
der 1000 Individuen der minimale Lohn K, zugeordnet. Es müssen aber, um 


das 90%-Quantil bestimmen zu können, noch die Löhne von 100 der 200, also 
50% der Personen mit einer Bildungsdauer von höchstens 10 Jahren verwendet 
werden. Dies bedeutet, dass die scharfe Untergrenze für das Oe oly( (10)w] -Quan- 


)- Quantil bestimmt werden muss: 


til über das da, ( 


A o =|a—P(z>10\w)|/P(z < 10|w) = (0,9 - 0,8)/0,2 = 0,5. 


Analog gilt fiir die Obergrenze die Bedingung oz P(z 2 tw), da Informationen 
für die Obergrenze nur aus den Individuen gezogen werden können, die min- 
destens t Jahre in Bildung investiert haben. Die Obergrenze für das qa ly o)w]- 
Quantil mit a = 0,7 ergibt sich dann aus den 700 der 880, also ca. 79,5% Perso- 
nen mit z 210. Die Obergrenze für das Ou. [y(10Jw]-Quantil ergibt sich dann 


mit A, = oi [P(z > 10|w)| = 0,7/0,88 = 0,795 als das qa, (y|w,z > 10)-Quantil. 


Damit lassen sich entsprechend den Grenzen im Worst-Case-Fall allgemein fol- 
gende Bereiche für die Unter- und Obergrenzen von a -Quantilen unterscheiden: 


<qaly(til< o (ylz2t) 
P(z>t) <as P(z2t) > q,,(ylz<st) <q,lyt)l< o, (ylz>t) 
<qly(t]< K 


3.60b 


3.60a 0 <as< P(z>t) > Ko 
3.60c 


P(z 2t) <a< 1 > q,,(ylzst) 
Dabei werden A, und A, bestimmt als: 


3.61) A )=[a-P(z>tlw)//P(z< tlw) =[a-[1- Piz s tlw) |]/P(z tlw) , 
(3.62) A,= a/P(z > tlw) . 


Im Vergleich zum nichtinformativen Bereich im Worst-Case-Fall ist der nichtin- 
formative Bereich für Quantile aufgrund der Annahme von MTR kleiner gewor- 
den. Dies lässt sich wie bei der Verringerung der Grenzen für den Erwartungs- 
wert begründen. Der Anteil an Beobachtungswerten, denen das Minimum oder 


Steffen Wirth - 978-3-631-75476-4 
Downloaded from PubFactory at 01/11/2019 04:32:44AM 
via free access 


63 


das Maximum zugeteilt werden muss, ist gesunken. Als Beispiel sei noch einmal 
angeführt, dass in (3.60a-c) die Bedingung für eine informative Untergrenze 
lautet, dass das betrachtete Quantil a größer sein muss als die Wahrscheinlich- 
keit P(z> t), wahrend die entsprechende Bedingung im Worst-Case-Fall 
a > P(z +t) lautete. Da die Ungleichung P(z #t)> P(z > t) jedoch stets erfüllt 
ist, verringert sich der nichtinformative Bereich bis auf den Fall, dass 
P(z + t)= P(z>t) gegeben ist. Dies gilt insbesondere für das kleinste Treatment 
t nin da hier P(z #t,,,,)=P(z>t,,;, ) immer gilt. 


Im Vergleich zu (3.25) ist in (3.60) der gemeinsame nichtinformative Bereich 
weggefallen. Es ist ausgeschlossen, dass Unter- und Obergrenze gleichzeitig fiir 
ein gegebenes a den Wert K, bzw. K, annehmen. Gegentiber den Worst-Case- 
Grenzen kommt nun sogar fiir jedes Treatment teT der Bereich 
P(z >t)< a < P(z 2 t) hinzu, dessen Breite auch von P(z = t) abhängt, und in 
dem sowohl Unter- als auch Obergrenze für ein gegebenes a vom Minimum 
bzw. Maximum verschieden sind. 


3.2.3.1.2 Informative Bereiche 


Auch für die Annahme von MTR sollen die verschiedenen Bereiche der Quantil- 
funktion grafisch dargestellt werden. Dabei ergeben sich im Vergleich zu dem 
Worst-Case-Szenario im Vorgriff auf die Interpretation der empirischen Ergeb- 
nisse wie beim Erwartungswert zusätzliche Erkenntnisse durch die Unterschei- 
dung, ob das kleinste, das größte oder ein anderes Treatment t betrachtet wird. 
Im Worst-Case-Szenario spielte diese Unterscheidung keine Rolle, da keine An- 
nahme über die Ordnung der Treatments getroffen wurde. 


Bei der grafischen Darstellung dieser Fälle anhand des Einführungsbeispiels mit 
K,=0 und K,=100 wird aus Vereinfachungsgriinden wieder eine 
Rechteckverteilung in [10 , 90] gewählt. Man erhält damit die Quantilfunktionen 
der Unter- und der Obergrenze in Tabelle 3.4. Fiir das kleinste Treatment t = 9 
gilt P(z 2 9)=1. Deshalb ist Bereich (3.60c) nicht relevant. Die Obergrenze ist 
somit immer vom Maximum K, verschieden. Je kleiner in diesem Fall der 
Anteil P(z=9), umso größer der informative Bereich der Untergrenze und 
damit der gemeinsame informative Bereich. Für das Treatment t=12, das 
zwischen dem kleinsten und dem größten Treatment liegt, gelten alle drei 


Steffen Wirth - 978-3-631-75476-4 
Downloaded from PubFactory at 01/11/2019 04:32:44AM 
via free access 


64 


Bereiche in (3.60). Je größer der Anteil P(z = 12), umso größer der gemeinsame 
informative Bereich. 


Tabelle 3.4: Quantilfunktionen im informativen Bereich, MTR 


Quantilfunktion im Quantilfunktion im 
t informativen Bereich der informativen Bereich der 
Untergrenze Obergrenze 
— 0,88 
ER x(F)=80-— +10 x(F)=80:a+10 


a — 0,24 a 
F)=80- “~~ 410 F)=80-— +10 
At a 
x(F)=80-a+10 x(F)= 80-55, +10 


Für das größte Treatment t =13, gilt P(z > 13)=0. Deshalb ist Bereich (3.60a) 
nicht relevant und die Untergrenze immer vom Minimum Kọ verschieden. Je 
größer der Anteil P(z = 13), umso größer der gemeinsame informative Bereich. 


Diese Grenzen für die Quantilfunktion in Tabelle 3.4 werden in den Abbildun- 
gen 3.9-3.11 dargestellt. 


Abbildung 3.9: Informativer und nichtinformativer Bereich der Quantil- 
funktion, MTR, t=9 


gemeinsamer informativer Bereich 
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Abbildung 3.10: Informativer und nichtinformativer Bereich der 
Quantilfunktion, MTR, t = 12 


100 


90 gemeinsamer 
informativer 


Bereich 


0 1 A 5 7 9 1 


a 
Abbildung 3.11: Informativer und nichtinformativer Bereich der 


Quantilfunktion, MTR, t =13 


100 
90 


10 gemeinsamer informativer Bereich 
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3.2.3.1.3 Scharfe Grenzen fiir Wahrscheinlichkeiten 


Neben Grenzen ftir Erwartungswert und Quantile der Responsefunktion kénnen 
auch Grenzen für Wahrscheinlichkeiten angegeben werden. Die Wahrschein- 
lichkeit Pan > rw], dass die Responsefunktion y(t) mindestens den Wert r 


annimmt, kann aufgrund der Annahme von MTR eingeschränkt werden auf 
(3.63) P(z Sr de ls Ply(t) > de le P(z <tuUy2 de 


Abbildung 3.12 unterteilt die Beobachtungspaare (z,y) in vier Regionen relativ 
zu (t,r). Jedes (z,y)-Paar in Region NW impliziert, dass die Responsefunktion 
y(t) mindestens den Wert r annimmt. Deshalb ist die Wahrscheinlichkeit 
Ply(t)> der mindestens so groß wie die Wahrscheinlichkeit, dass das (z, y)- 


Paar in diesem Bereich liegt und zwar P(z <tny2 r|w). 


Abbildung 3.12: Informative Bereiche fiir Wahrscheinlichkeiten, MTR 


Identifikation von P 


Jedes (z,y)-Paar in der Region SO impliziert, dass die Responsefunktion an der 
Stelle t einen Wert kleiner als r annimmt. Daraus folgt, dass die Wahrschein- 
lichkeit Ply(t) > der höchstens so groß ist wie die Wahrscheinlichkeit 


P(z <tuy2 rw), also dass das (z,y)-Paar außerhalb der Region SO liegt. Die 


(z,y)-Paare in der Region NO tragen nichts zu der Bestimmung dieser Wahr- 
scheinlichkeit bei, da für diese Wertepaare z>t gilt und deshalb das Minimum 
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Ko die Untergrenze für y(t) ist. Die (z,y)-Paare in Region SW tragen ebenfalls 


nichts zu dieser Wahrscheinlichkeit bei, da für diese Paare z<t gilt und deswe- 
gen das Maximum K, die Obergrenze für y(t) ist. 


3.2.3.1.4 Scharfe Grenzen für D-Treatmenteffekte 


In Abschnitt 3.2.2 konnte im Worst-Case-Szenario das Vorzeichen des Treat- 
menteffekts nicht identifiziert werden. Die Unter- und Obergrenze des Treat- 
menteffekts waren gleichermaßen durch Annahme und empirische Evidenz be- 
stimmt. Durch die Ordnung der Treatments und der Annahme schwach monoton 
steigender Responsefunktionen ergibt sich eine Asymmetrie hinsichtlich Unter- 
und Obergrenze, die auch in den Abschnitten 3.2.4 und 3.2.5 gilt und deshalb 
vorab erläutert wird. 


Die Monotonie der individuellen Responsefunktionen y;(-) impliziert, dass für 
alle Personen jeJ und alle Treatments t, >t, das individuelle Ergebnis bei 
Treatment t,, y,(t,), das bei t,, vil, stochastisch dominiert. Daraus folgt 
aber unmittelbar, dass y ,(t,) — wegen der schwachen Monotonie — höchstens so 
groß sein kann wie y,(t,). Damit ist jedoch Null die Untergrenze des Treat- 


menteffekts, die nicht mehr durch die empirische Evidenz, sondern durch die 
Annahme von MTR bestimmt ist. 


Die Annahmen in den Abschnitten 3.2.4 und 3.2.5 werden mit ähnlicher Argu- 
mentation, von der Annahme monotoner Treatmentselektion (MTS) abgesehen, 


zu demselben Resultat, zur Identifikation des Vorzeichens des Treatmenteffekts 
führen. 


Bei Annahme von MTR ergeben sich deshalb die folgenden scharfen Grenzen 
für Punktschätzungen der AD- und DA - Treatmenteffekte, mit t, >t,, jeJ. 


AD -Treatmenteffekte: 
(3.64) 0< Diy(t, \w]- Diy(t, w] = Diy, (t, \w]- Diy, D jw] i 


Die Grenzen in (3.64) sind scharf, da es keine Restriktionen zwischen den Indi- 
viduen gibt und somit Monotonie und empirische Evidenz konsistent sind so- 
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wohl mit y (t,)= y (ty) für die Untergrenze des Treatmenteffekts als auch mit 
y dl yı i(t) bei gleichzeitigem y dp )=Yo j (t ) für die Obergrenze des Treat- 
menteffekts. In (3.65) sind alle möglichen Fälle für t,, t,, z; und die 
dazugehörigen Grenzen angegeben. 


t <t < 2) > Ky < y(t) S yj(t,) S yj 
t < t, = 2) > K < y;(t) < y,(t,) = yj 
(3.65) t < 2; < t > Ky < y(t) < yj < y(t) = K, . 
t =Z <t, > yj = yj) < y(t.) < K, 
Zi < t <t > yj sy) < yj(t,) < K; 


DA -Treatmenteffekte: 


(3.66) D(0)< Datt, )- sit, jw] S Diy, (t.)—yo(t, jw] 


Die Untergrenze 0 wird stochastisch dominiert von der Differenz y(t,)- ylt,), 
die bei der Annahme von MTR nicht negativ sein kann. Diese Differenz wie- 
derum wird stochastisch dominiert von der Differenz der Obergrenze an der 
Stelle t, und der Untergrenze an der Stelle t,, y,(t.)—yo(t,). 


Die Untergrenze des AD- und des DA-Treatmenteffekts resultieren demnach 
allein aus MTR und hängen nicht von der empirischen Evidenz ab, während die 
Obergrenzen der Treatmenteffekte von der Annahme von MTR und der empiri- 
schen Evidenz bestimmt werden. Auf die Humankapitaltheorie übertragen be- 
deutet dies, dass durch die Annahme von MTR die Bildungsertragsrate bei jeder 
Person und damit auch aggregiert durchschnittlich nie kleiner Null sein kann. Im 
Unterschied zum Worst-Case-Fall ist das Vorzeichen des Treatmenteffekts da- 
mit identifiziert. 


Für den durchschnittlichen Treatmenteffekt ATE 
(3.67) Ely(t, }w]- Ely(t, Jw]=E El(y(t,) (t,)- (tw) 


ergeben sich damit die scharfen Grenzen in (3.68), wobei die Obergrenze wieder 
ermittelt wird als Obergrenze des Erwartungswertes bei t, abzüglich der Unter- 
grenze des Erwartungswertes bei t;: 
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0 < Ely(t, Jw]-Ely(t, Jw|= Ely(t,)— y(t, Xw] 
(3.68) < D -P(z < Geh Ell, > t,)- P(z > Gel 
= e, -P(z > GE ti ): P(z = el 


Untergrenze fiir E[y(t, )] 


Die Obergrenze des Treatmenteffekts in (3.68) lässt sich so umschreiben, dass 
die Obergrenze von drei Bereichen der Treatmentvariablen abhängt, (3.69), wo- 
bei deutlich wird, dass bei Annahme von MTR im mittleren Bereich für reali- 
sierte Treatments t, <z<t, empirische Evidenz keine Rolle spielt und der Bei- 


trag lediglich von der Spannweite (E, — Kọ ) abhängt. 
Ky - E(ylw,z<t;) Kı -Kọ E(y|w,z > t2)-Ko 
z<stj ty t| <z<ta to t2 SZ 


k, = E = t P(z<t,)+ et: z GL Kol P(z2t,) 


(3.69) 
+(K,-K,)-P(t, <z<t,) 


Für Els 2 t,) =K, und Elle < t,)= K, erhalt man dann wieder den maximal 
möglichen Treatmenteffekt K, -K;: 


(3.70) K,-P(z<t,)+K,-P(z>t,)—K,-P(z>t,)—K,-P(z<t,)=K,—K,y 
Dieser mit der empirischen Evidenz und der Annahme von MTR verträgliche, 
maximal mögliche Treatmenteffekt gilt sowohl für den durchschnittlichen 


Treatmenteffekt (ATE) als auch für die Quantil-Treatmenteffekte. 


Im Vergleich zu Abschnitt 3.2.2, in dem die maximal mögliche Intervallbreite 
2-(K, -K,) betrug, konnte die maximal mögliche Intervallbreite immerhin hal- 


biert werden. 


Bei den Quantil-Treatmenteffekten müssen jedoch wegen 


(3.71)  alyltIwJ- alyttJw]z#alytt)-ylt)w] ; 
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wieder die beiden Varianten des Treatmenteffekts, Aq und gA, unterschieden 
werden. 


Für die Aq -Quantil-Treatmenteffekte gelten fiir ein gegebenes a: 


(3.72) 0<agly(t, w]-aaly(t belger wl-aalyo(t. Jw] ; 


und die maximal mögliche Intervallbreite 


0 < qa y(t Jw]-aaly(t, Jw] 
(3.73) < q,(lywz2t,) - q, be, <t) 
Obergrenze fiir qa [y(tə )] Untergrenze für q a [y(t, )] 
< 


K, -K9 


Auch hier folgt wieder entsprechend dem durchschnittlichen Treatmenteffekt 
aus der schwachen Monotonie qaly(t,}w]2 qaly(t, wl], weshalb die scharfe 


Untergrenze durch Null vorgegeben ist und nicht von der empirischen Evidenz 
abhängt. 


Für die qA -Quantil-Treatmenteffekte gilt für ein gegebenes a: 


(3.74) q(0) = galytt,)- y(t, jw] < galyı (t,)- Yo (t, }w] <K -Ko . 


3.2.3.2 Semi-monotone Responsefunktionen (SMTR) 


Welche Änderungen ergeben sich, wenn die individuellen Responsefunktionen 
in Abhängigkeit von mehr als einer Treatmentvariablen formuliert werden? In 
diesem Abschnitt wird die Annahme schwach monotoner Responsefunktionen 
erweitert, indem eine bzw. mehrere Treatmentvariablen zusätzlich in der Res- 
ponsefunktion aufgenommen werden.” 


"7 Vgl. zu diesem Abschnitt Manski (1997a), S. 1322-1327. 
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3.2.3.2.1 Treatmentvariablen und Kovariaten 


Bisher wurden individuelle Response-Funktionen y,(t) untersucht und dabei 
Gedankenexperimente der folgenden Art durchgeführt: 


"Welches Ergebnis würde Individuum j realisieren, wenn es 
statt dem realisierten Treatment z die Treatments t einer 
Treatmentvariablen T erhalten hätte?" 


Bei diesem Gedankenexperiment werden bei Variation der Treatments die Ko- 
variaten u, des Individuums j konstant gehalten.” Ausführlicher geschrieben, 


werden dabei die individuellen Responsefunktionen 
(3.75) —-y,(t)=y;(t,u,) 


untersucht. Betrachtet man wieder schwach monoton steigende Responsefunkti- 
onen, ist die Annahme von Monotonie in y(-) äquivalent zu der Annahme von 
Monotonie 


(3.76) y;(,u;) mit tst > y; (tiuj) s y;(t,,u,) 


Die Responsefunktion y(t) drückt somit beispielsweise die Verteilung des Ein- 
kommens aus, die sich ergeben würde, wenn alle Individuen das Treatment t bei 


realisierten, konstant gehaltenen Kovariaten u, erhalten würden. Der durch- 


schnittliche Treatmenteffekt E|y(t, )]- Ely(t, H vergleicht dann die Erwartungs- 
werte bei t, und t,, falls die Kovariaten konstant gehalten werden. 


Läßt man zu, dass die Variation der Treatmentvariablen eine Variation der Ko- 
variaten bewirkt, muss man eine individuelle Responsefunktionen der Kovaria- 
ten ("Covariate Response Function") definieren: 


(377) U0.T>U . 


7 Vel. dazu auch die Erläuterungen zum Gebrauch des Begriffs der Kovariaten in Abschnitt 
3:12, 
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Diese bildet Treatments t in die Kovariaten ab, so dass sich mit u j=u d ;) die 
individuelle Responsefunktion schreiben lässt als 


3.78) y,(t)=y"[tu,(t)] . 


Auch hier ist Monotonie in y;(-) äquivalent zur Monotonie in 


379) vol mt tst >y lut) y ltu). 


Der durchschnittliche Treatmenteffekt E[y(t,)]—Ely(t,)] vergleicht bei dieser 
Formulierung dann die Erwartungswerte bei t, und t, unter gleichzeitiger Be- 


riicksichtigung des Zusammenhangs zwischen der Treatmentvariablen und den 
Kovariaten. Dies bedeutet jedoch weder, dass sich die beiden Formulierungen 


(3.75) und (3.78) widersprechen müssen, y` It, u lz hui noch, dass sich 
die beiden Varianten entsprechen, y“ ku l= y t, u W Unter der Voraus- 
setzung, dass die Responsefunktionen in beiden Fällen monoton sind, folgt 
vielmehr, dass bei beiden Varianten die aggregierten Responsefunktionen 
v D | und y [tu KO) innerhalb der gemeinsamen scharfen Grenze 


[yoy] liegen. 
Nun wurden bisher die Fälle untersucht, bei denen 


e das Treatment t bei konstanten Kovariaten u, 


e das Treatment t und gleichzeitig die Kovariaten u 


variiert werden. Es bleibt noch der Fall übrig, in dem die Kovariaten u bei kon- 
stantem Wert t der Treatmentvariablen variiert werden. Die Betrachtung dieser 
Fälle soll auch verdeutlichen, dass es bei der Analyse von Responsefunktionen 
keinen grundlegenden Unterschied zwischen Treatments und Kovariaten gibt. 


Um nun zu untersuchen, welche Grenzen sich für die Responsefunktion y(t) bei 
Variation von u unter Konstanthaltung von t ergeben, wird die Treatmentvari- 
able T zu einem Treatmentvektor erweitert, in den die bisherige Kovariate u 
aufgenommen wird. Während in Abschnitt 3.2.3.1 einfach angenommen wurde, 
dass T geordnet sei, macht folgendes Beispiel deutlich, dass eine solche 
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Ordnung im Fall eines Treatmentvektors nicht immer möglich ist. 
s:=(5,,85,...,8,) und t:=(t,,t,,...,t,) seien beispielsweise zwei 
Inputvektoren, für die s, <t, für alle k Elemente erfüllt ist. In diesem Fall sind 
die beiden Treatmentvektoren s und t geordnet, es gilt (zs und daraus folgend 
für die Ergebnisse y,(s) < y;(t) für alle j Individuen. 


Falls es dagegen zwei Inputkomponenten k und k' gibt, für die s, <t, und 
Sx > ty gilt, können die Ergebnisse y,(s) und y;(t) nicht geordnet werden. Die 
Produktionsfunktionen sind dann lediglich halb-monoton (semi-monoton). Die 


Menge der Treatments T bezeichnet man dann auch als halb-geordnete Menge. 
Ungeordnete Treatmentpaare (s, t) werden als s¢t geschrieben. 


Die Analyse wird durch halb-geordnete Treatmentpaare nicht erschwert. Intuitiv 
folgt aus den vorangegangenen beiden Abschnitten, dass dann bei der Analyse 
scharfer Unter- und Obergrenzen für diese halb-geordneten Treatmentpaare an- 
stelle der empirischen Evidenz das Minimum Kọ für die Untergrenze bzw. das 
Maximum K; für die Obergrenze verwendet werden muss. Die Analyse halb- 
monotoner Responsefunktionen folgt der Struktur, die bei der Analyse monoto- 
ner Responsefunktionen erarbeitet wurde. 


3.2.3.2.2 Scharfe Grenzen für D-Parameter 


Zur Bestimmung scharfer Grenzen für die D-Parameter aufgrund der Annahme 
von SMTR kann man die Definitionen der scharfen Untergrenze y,;(t) und der 


scharfen Obergrenze y,;(t) der individuellen Responsefunktionen 


Yoj(t):= y; fallsz;<t 
:= K, sonst 

y(t) := y; fallsz,>t 
:= K, sonst 


(3.80) 


der Annahme von MTR verwenden und muss lediglich zusätzlich die ungeord- 
neten Treatmentpaare sét berücksichtigen: 
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z; > t= Ky syj(t)<y; 
zi=t> yj(t)=yj 

z,<t> y,<sy(t)sK, 
z#t >K,<sy;i(t)<sK, 


(3.81) 


(3.81) kann wieder wie in den Abschnitten 3.2.2.1 und 3.2.3.1.1 alternativ for- 
muliert werden als: 


gail = y; fallsz; <t informative Untergrenze 
(3.82) = Ko fallsz,>t,z,#t , nicht informative Untergrenze 
y(t) = yj fallsz,>t : informative Obergrenze 


= K, falls z,<t,z,#t,, nicht informative Obergrenze 


Wie in der Einführung zu Abschnitt 3.2.3 bereits angedeutet, hat das Auftreten 
halb-geordneter Treatmentpaare Auswirkungen auf die Identifikationskraft, d.h. 
auf die Breite der Intervallgrenzen: 


e Jedes Mal, wenn ein Treatmentpaar (tz j) mit z; <t ungeordnet ist, fällt 
die Untergrenze der Responsefunktion, y,;(t), vom realisierten Ergebnis 
yj auf das Minimum K). 

e Jedes Mal, wenn ein Treatmentpaar (t,z i) mit z; >t ungeordnet ist, steigt 
die Obergrenze der Responsefunktion y,;(t) vom realisierten Ergebnis y; 
auf das Maximum K,. 


Daraus folgt im Sinne der Definition der stochastischen Dominanz, dass die mo- 
notonen Responsefunktionen für die Untergrenze y,,(t) die halb-monotonen 


Responsefunktionen stochastisch dominieren, während die monotonen Respon- 
sefunktionen für die Obergrenze y,;(t) von den halb-monotonen Responsefunk- 


tionen stochastisch dominiert werden. Durch die Einführung eines Treatment- 
vektors und damit der Einführung möglicher, halb-geordneter Treatments wird 
die Annahme monotoner Responsefunktionen zur Annahme halb-monotoner 
Responsefunktionen abgeschwächt, mit der Folge, dass die Grenzen und das In- 
tervall für die D-Parameter D|y(t)] geweitet wurden. 


Das Konzept semi-monotoner Responsefunktionen ist insofern allgemeiner als 
die beiden bisher vorgestellten Ansätze, als sich diese jeweils als Spezialfall der 
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semi-monotonen Responsefunktionen ergeben. Gibt es keine ungeordneten 
Treatmentpaare sét. vereinfacht sich (3.82) zum Fall monotoner Responsefunk- 
tionen, sind dagegen alle Treatmentpaare s und t ungeordnet, ergibt sich der 
Spezialfall der Worst-Case-Grenzen. 


Aus (3.82) folgt für die Grenzen des Erwartungswertes aufgrund der Annahme 
von SMTR, dass sich im Unterschied zu (3.56) lediglich der Anteil der Paare 
mit K, bzw. K, entsprechend dem Anteil der ungeordneten Paare sét erhöht: 


Ko -P(z>tUzs tlw + Elyw,z<t]-P(z<tjw) 
Ely(t)w 
K, -P(z<tUzstlw)+ Ely 


(3.83) 


IA JA 


Wize d P(z = tiw) 


Auch die Grenzen für die Quantile der Responsefunktion aufgrund der Annahme 
von SMTR müssen gegenüber der Annahme von MTR lediglich hinsichtlich 
dem Anteil der ungeordneten Treatmentpaare s$t angepasst werden: 


0 <as P(z>tUzst) > Ko <q,ly(t 

3.84) P(z>tUz#t) <a< l = qa [ylz <t] <qaly(t 
| 0 <as Pzt) > gelbill <alylz>t]’ 

P(z2t) <a< l => qaly(t)] <K, 


wobei A, und A, bestimmt werden als 


(3.85) A _a-P(z>tuzstlw) a-l- PE < tw) 
| "T'si Pesi) 


a 


Vergleicht man die Grenzen fiir die Bereiche in (3.84) mit denen in (3.60), er- 
kennt man eine weitere Asymmetrie zwischen Erwartungswert und Quantilen. 
Bei der Bestimmung der Grenzen der Quantile verändern sich lediglich die Be- 
rechnung der Untergrenze über A, und der Bereich, in dem die Untergrenze 


nicht informativ ist. Dieser erweitert sich von P(z > de durch den Anteil der 
ungeordneten Treatmentpaare auf P(z > tUz¢tlw). Sowohl der Bereich 
O<as P(z 2 tlw) als auch die Berechnung über à, wird bei der Bestimmung 
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der Obergrenze von halb-geordneten Treatments gegenüber der Annahme von 
MTR nicht verändert.’* Ursache dieser Asymmetrie ist, dass der informative Be- 
reich der Obergrenze weiterhin nur von P(z 2 tlw) abhängt, da allen ungeordne- 


ten Treatmentpaaren z,#t und den Paaren mit z; <t bei der Bestimmung der 


Obergrenze das Maximum K, zugeteilt wird. Um eine informative Obergrenze 
angeben zu können, dürfen dann aber wegen der Definition der Quantile nur die 
Ergebnisse der Personen, für die z 2 t gilt, verwendet werden. Nach (3.84) geht 
für diese bei der Bestimmung der Obergrenze das realisierte Ergebnis ein, so 
dass sich gegenüber (3.60) nichts ändert. 


Gleiches gilt für die Bestimmung der Grenzen der Wahrscheinlichkeit 
Plan > rlw], die der Vollständigkeit halber angegeben werden. In (3.63) ändert 


sich lediglich die Obergrenze für die Wahrscheinlichkeit zu: 


(3.87) P(z Striy] del Ply(t) 2 SE P(z <tUzétuy2 de) 


3.2.3.2.3 Scharfe Grenzen fiir D-Treatmenteffekte 


Auch die Analyse der scharfen Grenzen für D-Treatmenteffekte erfordert ledig- 
lich eine marginale Anpassung. Es müssen nur die Untergrenzen für den Fall 
ungeordneter Treatmentpaare geändert werden. So ist nun bei beiden Treatmen- 
teffekten, AD und DA, jeweils zwischen geordneten t>s und ungeordneten 
t¢s Paaren zu unterscheiden. Da die scharfen Grenzen für den Erwartungswert 
und für die Quantile bei Annahme von SMTR zu größeren Intervallen für die 
Treatmenteffekte führen, wird auf eine ähnlich ausführliche Darstellung wie in 
den letzten Abschnitten verzichtet. 


Die Grenzen für AD-Treatmenteffekte werden getrennt nach geordneten, t>s, 
und ungeordneten (ds. Treatmentvektoren bestimmt: 


(3.88) 0<Dly(t)|-Dly(s)]< Diy, (t)]- Dlyo(s)] , für t>s. 


(3.89) ` Dly,(t)|-Dly,(s)]s Ga Diy(s)]s Diy, (t)]- Dlyo(s)] ‚für tøs. 


™ Diese Asymmetrie bei der Bestimmung der Quantile im informativen Bereich findet man 
bei Manski (1997a), S. 1325, nur äußerst indirekt bei der Bestimmung der D- 
Treatmenteffekte angesprochen. 
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Die Bestimmung der Grenzen erfolgt analog zur Annahme von MTR, weshalb 
auf einen formalen Beweis verzichtet wird. 


Zuerst werden die Grenzen für geordnete Treatmentvektoren betrachtet. Da das 
Ergebnis bei dem Treatmentvektor t, y Jl das bei Treatmentvektor s, y AOF 


stochastisch dominiert, ist wieder Null die Untergrenze des Treatmenteffekts, 
die somit nicht von der empirischen Evidenz abhängt. Da die kleinste obere 
Schranke y,(t) das Ergebnis y Jl und das Ergebnis y (s) die größte untere 


Schranke y,(s) stochastisch dominiert, stellt die Differenz D|y,(t)]- D[y,(s)] 
die Obergrenze des Treatmenteffekts dar. 


Für ungeordnete Treatmentpaare greift die Monotonieannahme nicht. Deshalb 
stellt in diesem Fall Null nicht die Untergrenze dar. Wie in Abschnitt 3.2.3.2.1 
schon angedeutet, greifen dann die Schranken des Worst-Case-Falls und damit 
die Worst-Case-Untergrenze. 


Auch die Grenzen für DA-Treatmenteffekte bestimmt man getrennt nach 
geordneten, t >s, und ungeordneten, t¢s, Treatmentvektoren: 


(3.90)  D(0)< Diy(t)—y(s)]< Dly,(t)— y,(s)] , für t>s. 
(3.91) Dy, (t)—y, (ss Dly(t)- y(s)] < Dly, (t)— yo (s)] , für tes. 


Aus der Dominanz der individuellen Responsefunktionen fiir geordnete Treat- 
mentvektoren t>s folgt wieder die Dominanz der aggregierten 
Responsefunktionen, so dass annahmegemäß für die Ergebnisse y(t)- y(s)2 0 
gelten muss, und damit die Untergrenze D|y(t)- viel z D(0) gegeben ist. Die 
Obergrenze bestimmt sich als D-Parameter der Differenz der Obergrenze des 
Treatmentvektors t und der Untergrenze des Treatmentvektors s, 


Diy, (t)- yo(s)]. 


Wie beim AD-Treatmenteffekt gilt bei ungeordneten Treatmentvektoren, dass 
die Monotonieannahme nicht greift, so dass anstelle von Null die individuelle 
Worst-Case-Grenze yo; (t)-y, ‚(s) möglich ist. Aggregiert stellt D[y,(t)- y,(s)] 


die Untergrenze dar. Damit ist wieder wie bei den AD-Treatmenteffekten im 
Gegensatz zu den geordneten Treatmentvektoren weder die Obergrenze noch die 
Untergrenze nur durch die Monotonieannahme bestimmt. 
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Diese mit der empirischen Evidenz und der Annahme von SMTR verträglichen, 
maximal möglichen Treatmenteffekte gelten sowohl für den durchschnittlichen 


Treatmenteffekt (ATE) als auch für die Quantil-Treatmenteffekte. 


Bei den Quantil-Treatmenteffekten müssen jedoch wegen (3.71) wieder die bei- 
den Varianten Aq und qA unterschieden werden: 


(3.92) ` qly(t)}w]-qly(s)w]aly(t)—y(s}w] . 


Für die Aq -Quantil-Treatmenteffekte gilt für ein gegebenes a und geordnete 
Treatmentpaare t>s allgemein: 


(3.93) O0<qaly(t)}w]-aaly(s)wl< aaly:(t}w]-aalyo(s\w]s K, Ka. 


Im gemeinsamen informativen Bereich, der nach (3.84) wie bei der Annahme 
von MTR von P(z = SCH abhängt, lässt sich (3.93) schreiben als: 


0 < aaly(t}w]-alye}w] 
(3.94) <s ga, Jumm, zz - qa, YWZ <s) 
—$$ 19 Ne 
Obergrenze für qa Iyit, )] Untergrenze für qa (y(t, )] 


Auch hier folgt wieder qaly(t, }w]> qdaly(t Jw] wie bei dem durchschnittli- 


chen Treatmenteffekt aus der schwachen Monotonie, weshalb die scharfe Unter- 
grenze durch Null gegeben ist und nicht von der empirischen Evidenz abhängt. 
Für ungeordnete Treatmentpaare tgs muss die Untergrenze von 0 wieder durch 
die empirische Evidenz ersetzt werden: 


395) qalyo(t)|-aaly,(s)]< aaly(t)]-aaly(s)]< aa ly: (t)]-aalyo(s) - 


Für die qA -Quantil-Treatmenteffekte gilt für geordnete Treatmentpaare t> s: 


(3.96) q(0) S qa [y(t ) -Z y(t, jw] S qa ly, (t, )- Yo D IEN 
Für ungeordnete Treatmentpaare (ds gilt: 


3IN  qalyo(t)-y,(sl< qaly(t)- y(s)l< aalyi(t)- yo(s)] - 
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3.2.3.2.4 Ein Test fiir die Annahme von SMTR 


Wie schon die Annahme exogener Treatmentselektion ist auch die Annahme 
semi-monotoner Responsefunktionen nicht testbar, weil fiir jede Person nur ein 
Ergebnis, ein Punkt der individuellen Responsefunktion fiir ein realisiertes 
Treatment bzw. einen Treatmentvektor, y iz (z i: beobachtbar ist. Die empirische 
Evidenz ist damit sowohl verträglich mit der Annahme, dass die individuellen 
Responsefunktionen schwach steigend auf den geordneten Treatmentpaaren 
bzw. Treatments (MTR) verläuft, als auch damit, dass jede Responsefunktion 
horizontal verläuft, d.h. y DOE y; VteT, jeJ ist. Daraus folgt, dass allein mit 


der empirischen Evidenz nicht gestestet werden kann, ob die Treatmenteffekte 
von Null verschieden sind. 


Kombiniert man jedoch die Annahme von 

ETS:  Ply(s)]= Plylz = s] und Ply(t)]= Plyz =t] 

mit der Annahme geordneter Treatmentvektoren bei der Annahme von 
SMTR: t>s=>y/(t)>y/(s) , 


können mit der anhand der Stichprobe identifizierten Verteilun Eet 
Treatments und Ergebnisse, P(z,y), die bedingten Verteilungen P ylz = s| und 


plylz = t] geschätzt werden. Damit ist es möglich, die gemeinsame Hypothese 


semi-monotoner Responsefunktionen und exogener Treatmentselektion abzu- 
lehnen, wenn es geordnete Treatmentpaare t2s gibt, bei denen die bedingte 
zur Plylz = = t] die bedingte Verteilung Plylz = = s] nicht stochastisch domi- 


niert.” 


Es wurden in der Literatur eine Vielzahl an Tests vorgeschlagen, die größtenteils 
auf der Arbeit von McFadden (1989) beruhen. In Abschnitt 3.2.5.3.3 wird bei 
der Kombination der Annahme von MTR und monotoner statt exogener Treat- 
mentselektion (MTS) eine abgeschwächte Version dieses Tests verwendet, die 
anstelle der Dominanz der bedingten Verteilungen lediglich Dominanz der be- 
dingten Erwartungswerte fordert. 


73 Vgl. Manski (1997a), S. 1327ff. 
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3.2.3.3 Konkav-monotone Responsefunktionen (CMTR) 


Im letzten Abschnitt wurde die Annahme der schwach monotonen individuellen 
Responsefunktionen abgeschwächt, indem ein Vektor von Treatmentvariablen 
und damit Semi-Monotonie eingeführt wurde. Nun wird die individuelle Res- 
ponsefunktion wieder in Abhängigkeit einer einzigen Treatmentvariablen be- 
schrieben und die Menge der möglichen individuellen Responsefunktionen ge- 
genüber der Annahme von MTR stärker dadurch eingeschränkt, dass ein kon- 
kav-monotoner Verlauf gefordert wird. Diese weitergehende Restriktion der in- 
dividuellen und damit auch der aggregierten Responsefunktionen hat, wie sich 
in Kapitel 3.2.7 beim Vergleich der Obergrenzen der Treatmenteffekte der ver- 
schiedenen Annahmen zeigen wird, erhebliche Identifikationskraft. Diese An- 
nahme wird im Folgenden mit CMTR bezeichnet. 


Die Annahme von CMTR bietet sich nicht nur wegen der stärkeren Identifikati- 
onskraft an. Sie entspricht der Spezifikation konkav verlaufender, in Abhängig- 
keit des Alters oder der Berufserfahrung geschätzten Lohnprofile aus Kapitel 2 
und erlaubt einen direkten Vergleich der parametrisch, semiparametrisch und 
nichtparametrisch geschätzten Ertragsraten. 


3.2.3.3.1 Scharfe Grenzen für D-Parameter 


Im Folgenden wird aus Darstellungsgründen für die Treatmentvariable T der 
Bereich [0,1] und für die Ergebnisvariable Y = [0,00] angenommen. Die Festle- 
gung der Untergrenzen von T und Y auf Null erlaubt eine übersichtlichere Dar- 
stellung der Konkavität in (3.98), ohne einen Verlust an Präzision hinnehmen zu 
müssen. Entscheidend für die Identifikationskraft der Annahme von CMTR ist 
ausschließlich, dass die Treatmentvariable T und die Ergebnisvariable bekannte 
untere Grenzen haben. Wie in Abschnitt 3.2.3.3.4 gezeigt, ergeben sich ohne 
diese Bedingung dieselben Grenzen wie im Fall schwach monotoner und sogar 
linear-monotoner Responsefunktionen. 


Die nun folgende Definition der Konkavität in (3.98) ist von zentraler Bedeu- 
tung für die Bestimmung der Grenzen der D-Parameter und der D-Treatmentef- 
fekte. Bei Letzteren wird erstmals eine Neudefinition der Grenzen nötig werden, 
die auf der Konkavitätsdefinition beruht. 
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Für drei Punkte (v,,,w,, )e [0, ol’, m =1,2,3 mit 0<v, < v, < v, ist Konkavitat 
gegeben, wenn die Bedingung 
Wis V2 Via 


3.98) MoM MaM Mag 
Er Mg Ny NaN 


erfüllt ist. Diese Bedingung ist in Abbildung 3.13 durch die abnehmenden Stei- 
gungen (1) bis (3) der stückweise linearen Funktion angedeutet. 


Abbildung 3.13: Konkavitét und Grenzen für die individuelle 
Responsefunktion 


ntergrenze bei 
th =Vvy 


0 Vi v2 V3 =Zj 


In Abbildung 3.10 ist der Fall dargestellt, dass das realisierte Treatment v, =z, 


dem größten Treatment entspricht. Für alle kleineren Treatments wurde sowohl 
nach dem Worst-Case-Szenario als auch bei Annahme von MTR als Unter- 
grenze der individuellen Responsefunktion K, angenommen. Aufgrund der 
Konkavität kann diese Untergrenze nun durch die in der Abbildung gekenn- 
zeichneten Untergrenzen ersetzt werden, die alle von K, verschieden sind. Für 
den Fall, dass das realisierte Treatment dem kleinsten Treatment entspricht, 
würde man entsprechend für K, verschiedene Obergrenzen erhalten. 
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Durch die Annahme der Konkavität der individuellen Responsefunktionen y ;(-) 


werden bei bekannten unteren Grenzen fiir die Treatmentvariable T und die Er- 
gebnisvariable Y alle Beobachtungen sowohl fiir die Unter- als auch fiir die 
Obergrenze informativ. Unter- und Obergrenze der Responsefunktion hängen 
somit in keinem Fall mehr von K, bzw. K, ab. Speziell mit T=[0,t] und 


Y =[0,00] gilt dann: 


z,<xt > Yj SYS Yj 
(3.99) Zelt > y,(t=y, 


Im Vergleich zu den Grenzen der monotonen Responsefunktionen in (3.52) 
können in (3.99) die größte untere Schranke, K,, bei der Bestimmung der Un- 


tergrenze und die kleinste obere Schranke, K,, bei der Bestimmung der Ober- 
grenze durch y; -(t/ Z a ersetzt werden, da die Annahme konkav-monotoner Res- 
ponsefunktionen mit y; / z; als durchschnittlichem Output die Extrapolation 


ye Wi Z 5) zur Bestimmung der Grenzen ermöglicht. 


Bezeichnet man nun die Untergrenze der individuellen Responsefunktion mit 
Y.0;(t) und die Obergrenze mit y,,;(t), lässt sich (3.99) wieder alternativ schrei- 


ben als 
3.100) ` Nal) SN Yat) , mit 


Yooj(t) = Yj falls z, <t 


KC vk sonst 


3 


at) = Y; falls z. > t 
(3.101b) Ji ) SE l 
= Wir sonst 
Dies bedeutet, dass die Untergrenze y,,,(t) das latente Ergebnis y ,(t) dominiert 
und dieses wiederum von y.,,(t) dominiert wird. Für die D-Parameter gilt dann: 


3.102) Dly.o(t)|w]< Dly(t)|w] < blya ow] - 
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Durch die Annahme der Konkavität ergibt sich damit für das Ergebnis y(t) 


zum einen, wie in Kapitel 3.2.7 gezeigt wird, ein engeres Intervall 
Bäi jt) Ya ,(t)| fiir die individuelle Responsefunktion im Vergleich zum Inter- 


vall lyo;(t), yı KO) bei Annahme von MTR. Zum anderen verhalten sich die In- 
tervallbreiten der individuellen Responsefunktionen für den bei Annahme von 
CMTR betrachteten Wertebereich Y = JO. al anders. Dies wird anhand der Um- 


formungen in (3.103) und (3.104) ersichtlich. Während sich die Intervallbreite 
bei Annahme von CMTR, (3.103), symmetrisch und linear in t von Null weg- 


bewegt, je weiter sich t von z j entfernt, verändert sich die Intervallbreite bei 
Annahme MTR, (3.104), asymmetrisch und linear, je nachdem ob z; <t oder 


z,>t ist. 


Stak <t}+y, Ib, ten, e, dl 
j 


ei i ak, 2 t|- yj .] Ze d LES GE 


J 


(3.103) CMTR ly,o,(t), ye1;(t)] : , 


—Z. —t 
Se alz, <t]+ y; la, >t] 


l Z) -t 
ei 

CID <t|+ yj alz, sily yj alz, =t] 

-fy al, <t]+0-I]z, > t]+ y, alk, =t} 


=o- y; Jil; <t]+ly, -0)-1lz, >t] 


e, et, afz; >t] 


= yj" 


=y 


(3.104) MTR ly,,(t),y,,(t)] : 


Bevor die Grenzen für den Erwartungswert ermittelt werden, sollen auch bei der 
Annahme von CMTR die informativen Bereiche grafisch dargestellt werden, 
siehe Abbildung 3.14. Aus der Annahme von MTR folgte in Abschnitt 3.2.3.1, 
dass die individuelle Responsefunktion y;(-) die Gebiete SW und NE durchque- 


ren muss. Durch die Annahme von CMTR folgt zusätzlich, dass y;(-) die Ge- 
biete WSW und ENE passieren muss. Der Strahl aus dem Ursprung mit der 
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Steigung y; / Z; wird zur Untergrenze für y,(t), falls z; zt und zur Obergrenze 
falls z,<t. Nimmt man für die individuellen Responsefunktionen y;() zu- 


sätzlich noch an, dass sie linear in t verlaufen, wird durch Beobachtung von 
(z pY i) y RO) identifiziert. Die individuelle Responsefunktion in Abhängigkeit 


von t ist dann 


(3.105) y;(t)= EI | 


J 


Abbildung 3.14: Informative Bereiche für Wahrscheinlichkeiten, CMTR 


output 


Aggregiert man die individuellen Responsefunktionen und berücksichtigt dabei 
die in (3.100) ermittelten Grenzen, ergeben sich die Grenzen der Erwartungs- 
werte der Responsefunktion Ely(t}w] bei Annahme von CMTR 


w,z<t)-P(z< tw)+ GE -tiw,z< A P(z> tlw) 
E y(t}w 
W,Z < t). P(z < t}w) + E(y 


E(y 


(3.106) 


IA AA 


ER d w,z > t)-P(z> SCH 


Die Grenzen unterscheiden sich im Vergleich zu den Grenzen bei Annahme von 
MTR in (3.56) lediglich durch das bereits beschriebene Ersetzen von K, und 


K, durch y; Ju Z J: Dadurch wird auch ohne formale Analyse, die in Abschnitt 


3.2.7 erfolgt, deutlich, dass die Verringerung der Intervallbreite davon abhängt, 
wie stark sich K, und K, von y; iz 9 unterscheiden. Da die Schranken K, 
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und K, nun ersetzt wurden und zudem nicht auszuschlieBen ist, dass die 
realisierten Ergebnisse y; kleiner bzw. größer als die Unter- bzw. Obergrenze 


y;-(t/z,) sind, muss die Ermittlung der Quantile a, ly(t)w] der 


Responsefunktion gegenüber den bisher verwendeten Annahmen geändert 
werden. Mit den Definitionen (3.100) bzw. (3.101) und der Indikatorfunktion 
l[-] wird in (3.107) je eine Verteilung für die Untergrenze und die Obergrenze 
definiert und das a- Quantil bestimmt: 


daly We <t]+2-t-[2 >t] 
< aaly(t\w] 
<q,[2-t-I[z<t]+y-I[z t] 


Durch die Annahme von CMTR erhält man für die Grenzen der Quantile hier 
erstmalig den Fall, dass es keine nichtinformativen Bereiche gibt. Die Beo- 
bachtung der Realisationen z, und y, führt unabhängig von der Betrachtung der 
Unter- oder Obergrenze und unabhängig von dem Wert t der betrachteten 
Treatmentvariablen zu Grenzen, die nicht durch K, und K, vorgegeben sind. 


3.2.3.3.2 Scharfe Grenzen für D-Treatmenteffekte 


Die Grenzen der D-Treatmenteffekte A(t,,t,) folgen wieder aus den gemeinsa- 
men scharfen Grenzen für die individuellen Responsefunktionen y (6) und 
Yj (t,). In den bisherigen Abschnitten ergab sich bis auf die Bestimmung der 


Untergrenze bei Annahme von SMTR stets, dass die Obergrenze (Untergrenze) 
des Treatmenteffekts als Differenz der Obergrenze (Untergrenze) für y i(t) und 


der Untergrenze (Obergrenze) für y i(t) ermittelt werden konnte. Wendet man 


dieses Verfahren auch bei der Annahme von CMTR an, kommt es dabei zu 
Verletzungen der gemeinsamen scharfen Grenzen, denn die Differenz der Ober- 
grenze für y DON und der Untergrenze fiir y BO berücksichtigt nicht die Ober- 


grenze der Steigung, die sich aus der Konkavität ergibt. Aus (3.98) folgen die in 
(3.108) formulierten Bedingungen, die Unter- und Obergrenze des Treatmentef- 
fekts erfüllen müssen. Mit Hilfe derselben fünf Fallunterscheidungen, die schon 
bei der Annahme von MTR in (3.65) getroffen wurden, lassen sich die Bedin- 
gungen angeben und die Verletzungen aufzeigen. 
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(3.98) M a MMi 5 MU zj 
vj a V3—V, 
TEE 
ti t, -t, Zut 
t<z= bh > y;(t) EAR y;-y;(t) >0 
(3.108) i GH SEA) 
(2236 b = y;ltı) > y;-y;(t) > y;(t.)-y; > 0 
ti Zuch t, zZ; 
(t (t 
z,=t< ty _, Yili) Yi, y;(t2) H T 
ti Zj bt? 
Zeches t > Yi > "inn  Ttslvdnl , , 
Z) db? Lt 


Der mögliche Widerspruch soll exemplarisch anhand der ersten Bedingung ge- 
zeigt werden. In Abschnitt 3.2.3.3.4 zu diesem Kapitel sind die restlichen Wi- 
dersprüche aufgeführt. 


Ersetzt man in der ersten Bedingung (t; <t, <z;) das latente Ergebnis bei t,, 
y;(t,), durch ly; /z;)- tı und das bei t,, y;(t,), durch y;, erhält man folgenden 


Widerspruch in (3.109), der sich bei der Bestimmung der Obergrenze mit 
y;(t)= Ycıj(t2) und y,(t,)= Yoo; (ty) ergibt. 


Yj yj 
rag yj ot yı=y. 
(3.109) t < t < z > — 3 — > 4H 2 0 
yjz; d 
oy2 = S yjta — yjti Ž yjz- yjt © yiti Ž yjz ot, 2z; 


Die erste Bedingung fordert, dass das realisierte Treatment größer als t, ist, 
Zz; >t,. Diese Ungleichung ist aber nicht gesichert, wenn man die in (3.99) für 


die individuellen Responsefunktionen ermittelten Grenzen in (3.109) einsetzt. 
Dies ist in Abbildung 3.15 dargestellt. 
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Abbildung 3.15: Verletzung der ersten Konkavitätsbedingung in (3.108) 


Yajltı)= Yaj(t2)=yj 


Yc0j (t2) 
KÉ (tı) 


Yeojlti) 


0 
ty Zj t, 2j 


Die Obergrenze des D-Treatmenteffekts A(t,,t,), für ein realisiertes Treatment 
zZ, berechnet als Obergrenze bei t, abzüglich der Untergrenze bei t,, ist durch 


die Gerade (2) in der Abbildung gekennzeichnet. Die Steigung der Geraden (2) 
darf aber nach (3.108) höchstens so groß sein wie die Steigung der Geraden (3). 
Da als Obergrenze das realisierte Ergebnis y; verwendet wird und deshalb nicht 
verändert werden kann, muss die Untergrenze der Responsefunktion bei t,, z H 
so korrigiert werden, dass die Steigung von (2) konsistent zu der Bedingung in 
(3.108) ist. Dies erfolgt durch Erhöhung der Untergrenze von z; auf Yey (t, ), 


wodurch die Steigung der Geraden (2) der Steigung der Geraden (3) angepasst 
wird. 


Die formale Ermittlung der Obergrenze des Treatmenteffekts besteht aus einem 
zweistufigem Verfahren, den größtmöglichen Wert von y HOER (t) zu fin- 


den, der die gemeinsamen Grenzen erfüllt. 


Man hält dazu auf der ersten Stufe y (6) fest und sucht das Minimum von 
y (ti) das den Bedingungen genügt. Damit erhält man die Obergrenze des 
Treatmenteffekts als eine Funktion von y oO) Auf der zweiten Stufe maximiert 
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man diese dann über alle möglichen Werte von y;(t,), d.h. für 
y(t, )e bat: ),yc;lt)]- 


Dies sei exemplarisch anhand der ersten Bedingung gezeigt. Im Fall t, <t, <z 
gilt y;(t,) = yj und man sucht den Wert für vlt) der 


EE 
(3.110) es a 
ti 37 ti 
ay: , o. . Y,;-X E 
erfüllt, die Steigung maximiert und dabei die Bedingung —— > =——— = 0 


nicht verletzt. Dazu löst man (3.110) nach x auf. Dies ergibt mit 
x(t, —t,)+x-t, =y j’ tı schließlich, nach x aufgelöst, als neue Untergrenze 


y; 
(3.111) "zelt 
2 


anstelle der alten Untergrenze y.o;(tı)=y,; -(t, /z; } 


W. W W. W W 

L> 2- Ls 3-''2 er- 

St MamYı 9735 
kd 


Mit dieser neuen Untergrenze ist auch (2) > (3) in 


ee 
(1) (2) (3) 
füllt. Dies zeigt die Probe 
(2)2> (3) — 2-20 EE 
t-t t-t 2 


Somit ergibt sich bei der Bestimmung des Treatmenteffekts die Untergrenze der 
individuellen Responsefunktion y,(t) an der Stelle t, bei den Personen, deren 


realisiertes Treatment z; größer als t, und t, ist, als yalı)a it. 
2 
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Für den Fall, dass das realisierte Treatment z, kleiner als t, ist, ergibt sich fol- 
gende Untergrenze y,,,, gezeigt an der Bedingung t; <z;<t,: 


3. yj—X „xt 


Vë Al Beem |Sy S@X=y,'— - 


l j 
4 Yj~X _ YjTřj , . 
Damit ist auch die Bedingung —— > ——— erfüllt, da z; >t, ist und somit 
ti : 
yj > yj: — gegeben ist. 
Z. 
J 


In Abschnitt 3.2.3.3.4 wird gezeigt, dass die Bedingungen auch für die anderen 
Fälle erfüllt sind. Die Untergrenze an der Stelle t, bei der Bestimmung des 


Treatmenteffekts muss demnach wie folgt definiert werden: 


t 
Yeti) = Y; E ‚falls t, < Z; 
2 
(3.112) 


Yaltı) =y; AL falls 2 St, 
= 
Aus den Definitionen für die modifizierte Untergrenze y,, und die Obergrenze 
Vu Kann nun für jede individuelle Responsefunktion die unter Berücksichti- 
gung von (3.108) zulässige Obergrenze der Differenz des Ergebnisses bei t, und 
t, bestimmt werden als Yerjlte)— Vey (ty). In Tabelle 3.5 sind die möglichen 
Fälle für die Unter-, die Obergrenze und die Differenz y,, DOE Va (t,) angege- 
ben. 
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Tabelle 3.5: Obergrenzen des Treatmenteffekts der individuellen Response- 
funktionen in Abhängigkeit des realisierten Treatments z; 


t 

2 
Treatmenteffekt Vi =f) t,) Yj 
Yajlt2)- Yalt) t, 


An der Untergrenze des Treatmenteffekts ändert sich im Vergleich zu den 
schwach monotonen Responsefunktionen nichts. Aufgrund der Monotonieeigen- 
schaft ergibt sich wieder die scharfe Untergrenze von Null.” 


Damit müssen nur noch die Obergrenzen für den DA- und den AD-Treat- 
menteffekt bestimmt werden. Da für den durchschnittlichen Treatmenteffekt 
beide Effekte identisch sind, kann die Obergrenze direkt aus der Betrachtung des 
DA -Treatmenteffekts ermittelt werden. Dies bietet sich hier an, da in Tabelle 
3.5 bereits scharfe Obergrenzen für den individuellen Treatmenteffekt 
Yoıj(t2)- alt) bestimmt wurden. Bildet man für diesen den Erwartungswert: 


EA = Ely,,,(t, )- Ye (t, ) d 
erhält man das Intervall 


= Yw|- Ely(t, jw] = Ely(t, )-y(t \w] 
El -t,|w,z < t, }- P(z < t,|w)+ E(y|w,z > t): P(z > t,|w) 


0 
(3.113) 


IA IA 


Jd nien < a -Plz < t,|w)+ SÉ lw, 2 < t, P(z > ell 
Z 


™ Vgl. Manski (1997a), S. 1332. 
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Mit den Grenzen aus Tabelle 3.5 lässt sich dieses Intervall übersichtlicher dar- 
stellen: 


© 
IA 


Ely(t, }w]- Ely(t, jw] SS Ely(t,)- y(t, jw] 


(t, - TEE 


Ylw,z< AE W,Z> a] 
Z t, 


Für die Untergrenze des allgemeinen DA -Treatmenteffekt folgt ebenfalls allein 
aus der Annahme der Monotonie der Responsefunktion D(0) und für die Ober- 
grenze mit der modifizierten Untergrenze y,,(t, ) 


(3.114) 


IA 


(3.115) D(0)< Dly(t,)- y(t, jw] < Dh, EE AU jw] e 


Daraus folgt, dass das Intervall fiir den QA-Treatmenteffekt bestimmt werden 
kann als 


(3.116) Q(0)<qaly(t,)— y(t, Jwlsaclyalt)-yaltı)w] - 


Auch die Untergrenze des AD-Treatmenteffekts ist wegen der Annahme der 
Monotonie der Responsefunktionen Null, fiir die Obergrenze lassen sich aller- 
dings im Unterschied zu dem DA-Treatmenteffekt keine scharfen Grenzen 
angeben”, so dass das Intervall in (3.116), mit y,,(t,) anstelle von y,,(t,) gebil- 


det 


(3.117) Os Dat, Jw|- Datt, w] = ES (t, }w]- Dh. (t; jw] 
zu konservativ ist, da es eine kleinere Obergrenze geben könnte. 


Da der AD- und der DA -Treatmenteffekt für die Quantile verschieden sind, gibt 
es für die Quantile somit bislang noch keine scharfe Obergrenze für den AD- 
Treatmenteffekt. Da die Obergrenze in (3.117) aber lediglich zu konservativ ist, 
wird im empirischen Teil diese Obergrenze für den AQ-Treatmenteffekt ver- 
wendet. 


78 Vgl. Manski (1997a), S. 1330. 
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3.2.3.3.3 Konkav-monotone und linear-monotone Responsefunktionen 


Für die konkav-monotonen Responsefunktionen in Abschnitt 3.2.3.3.1 wurde 
eingeführt, dass die Ergebnis- und die Treatmentvariable bekannte untere Gren- 
zen haben. Anstelle des Wertebereiches Y =[K,,K,] wurde der Wertebereich 
Y =[0,.0] bzw. T=[0,t] für die Bedingung in (3.98) festgelegt, wobei Null als 
bekannte untere Grenze lediglich gewählt wurde, um die Darstellung zu verein- 
fachen. Nun soll gezeigt werden, dass sich die Grenzen aufgrund der Annahme 
konkav-monotoner und sogar linear-monotoner Responsefunktionen von den 
Grenzen bei Annahme monotoner Responsefunktionen nicht unterscheiden, 
wenn die Wertebereiche Y =[K,,K,] und T = [0,1] zugelassen werden. 


Schreibt man die individuellen Responsefunktionen als 
(3.118) y,(t)=B,;-t+u, ,B,20, 


folgt dann aus der Beobachtung der realisierten Werte (z py ;) mit 


(3.119) u,=y,-ß,'z; 
für die individuellen Responsefunktionen in Abhängigkeit von t 
3.120) y,(t)=B,-(t-z,)+y; . 


Mit zwei geordneten Treatments t,,t, ET, t; <t,, ergeben sich dann die folgen- 
den scharfen, gemeinsamen Grenzen für y DON und y i(t) in (3.121). Diese 
entsprechen exakt den Grenzen der individuellen Responsefunktionen aufgrund 
der Annahme von MTR aus Kapitel 3.2.3.1. Die Verwendung linear-monotoner 


anstelle monotoner Responsefunktionen hat somit bei dem Wertebereich 
Y =[K,,K,] keine Erhöhung der Identifikationskraft zur Folge. 


t <t, <z > Ky < y(t) < y;(t,) < yj 
t < t =z) > Ky < yj(t) < yj(t2) = y; 
(3.121) t < z; < t > Ky < vil < yj < yit) < K; 
t =z <t, > yj = yj(t) < y,(t,) < K, 
Z; < t <t > Yj = y ;(t,) = y;(t,) < K, 
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3.2.3.3.4 Überprüfung der Konkavität 


In Abschnitt 3.2.3.3.2 wurde bei der Untersuchung der Grenzen für den Treat- 
menteffekt die erste der fünf Bedingungen in (3.108) dazu verwendet, um die 
neue Untergrenze y,, (t,)= (y i/ t,)- t, zu ermitteln, da mit der Definition der Un- 


tergrenze in (3.101) gegen diese erste Konkavitätsbedingung verstoßen wurde. 
In diesem Abschnitt wird überprüft, gegen welche anderen Bedingungen diese 
Untergrenze (3.101) verstößt. 


W.-W, Wa Wi 


eos, M > MM a M Se 
V} KN V3—V> 

h<tp<z, ee, GI — 
t, Geh z,-t, 

<z,=t > y (ty) „ ¥ilte)— vit) _ y;-y;(t) >0 
Se t, t-t GIE? 

Lane >» YW , DO en 
t, DIE GET? 

SE yit) np. yilb)-y; Sg 

t 2 t,-z; 

ee D zs Dn „ee, 

Zj bt? t, -t, 


e Zweite Bedingung: 
Ersetzt man in der zweiten Bedingung das latente Ergebnis y,(t,) durch 
(y j / Z i) t, und y,(t,) durch y,, erhält man keine Verletzung, da bei die- 
ser Bedingung Zz; =t, vorgegeben ist: 


Yj Yj Yj 
t eeng y= et 
Se j 05 
ti <t, =z; > 2 = 20 
_ vlt, t] yı=y 
j t-t jJj 
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e Dritte Bedingung 
Ersetzt man in der dritten Bedingung y,(t,) durch ly, /z ‚ti und yj(t2) 
durch (y ‚fz i) t,, erhält man ebenfalls keine Verletzung: 


ee en DEU > neue 5 ly;/2)) 2-7; >0 
a ëch ty Fe 


EE lie b/a) ty o 


=20 


Zj 


e Vierte Bedingung 
Ersetzt man in der vierten Bedingung y,(t,) durch y; und y,(t,) durch 


(y (JS )-t,, erhält man auch keine Verletzung: 


pes hr SE 
Z; t-z, 


BEER ahal so 


Sie ish 


J J 


e Fünfte Bedingung 
Erst bei der letzten Bedingung, beim Ersetzen von y i(t) durch y; und 


von y i(t) durch (y ‚/z; a t,, ergibt sich wieder eine Verletzung: 


Andi Yj u Ce >0 


Z,<t)<t,> 
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3.2.3.3.5 Uberpriifung der scharfen Untergrenze fiir den Treatmenteffekt 


Nachdem im letzten Abschnitt untersucht wurde, in welchem Fall der Konkavi- 
tätsbedingungen in (3.108) Verletzungen durch die Definitionen der Grenzen der 
individuellen Responsefunktion (3.99) auftreten, soll in diesem Abschnitt über- 
prüft werden, ob die in Abschnitt 3.2.3.3 neu definierte scharfe Untergrenze der 


individuellen Responsefunktion (3.112) allen Bedingungen in (3.108) genügt. 


Die erste Bedingung, t, <t,<z,, und die dritte Bedingung, t, <z,<t,, wurden 
schon in Kapitel 3.2.3.3 behandelt und zur Definition der scharfen Untergrenze 


Yo (3.112) verwendet: 


Yaltı)azy Z 
(3.112) 


t 
Yaj(ti)= y; 


m. 


‚falls t,<z, 


‚falls t, 2z; . 


e Für die zweite Bedingung, t; < t, =z,, gilt wegen t, =Z; 


l> J ai Si DEE 
und damit auch 
ya 
E 
TEE , din Zj a Dn 
e Für die vierte Bedingung, z; = t, < ty, gilt 
yj t2-Zj 
It. Zar, 
Ee E ET , 
Z; kt? Zi t,-Z; Z; Z; 


J J J 
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e Für die fünfte Bedingung, z; <t; <t,, gilt: 


ety yj 
; -u ; ` f ; 
Pig i) hg) a Ten 
und 

Yj Yj ks 
2 A . ; i ; 
EE 


Somit erfüllt die Definition der Untergrenze y,, (t,) gemäß (3.112) alle Bedin- 


gungen in (3.108) und ist eine scharfe Untergrenze der individuellen Response- 
funktion zur Bestimmung der Obergrenze von Treatmenteffekten auf der 
Grundlage konkav-monotoner Responsefunktionen. 


Nachdem nun unterschiedlich ausführlich verschiedene Varianten des Konzepts 
der Responsefunktionen analysiert wurden, soll im nächsten und letzten Teil ein 
Fazit dessen gezogen werden, was diese Restriktionen der individuellen Respon- 
sefunktion bewirken können. 


3.2.3.4 Was können Restriktionen der Responsefunktion leisten? 


Mit den Annahmen monotoner, semi-monotoner und konkav-monotoner Res- 
ponsefunktionen wurden Annahmen aus der Produktionstheorie eingeführt, um 
die Worst-Case-Grenzen für D-Parameter und D-Treatmenteffekte aus Abschnitt 
3.2.2 zu verbessern und im Hinblick auf die parametrischen und semiparametri- 
schen Ansätze in Kapitel 2 die Konsequenzen eines nichtparametrischen Mo- 
dells zu untersuchen. 


Alle drei Varianten beschränken sich auf die Responsefunktionen der Indivi- 
duen. Diese Responsefunktionen bleiben voneinander völlig unabhängig und 
können deshalb umfassend aggregiert werden, um die Verteilung der Treatmen- 
teffekte analysieren zu können. Der Selektionsprozess in die Treatments findet 
dabei keine Berücksichtigung. Diese Problematik wird in den Abschnitten 3.2.4 
und 3.2.5 behandelt. 
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Gegenüber den Worst-Case-Grenzen konnte eine deutliche Verbesserung erzielt 
werden, die im Fall der konkav-monotonen am stärksten, bei den semi-monoto- 
nen Responsefunktionen am geringsten ausfällt. Während bei den Worst-Case- 
Grenzen nur die Beobachtungswerte mit z; =t und deren tatsächlich realisierte 


Ergebnisse y; zur Bestimmung der Grenzen bei Treatment t berücksichtigt wer- 


den, liefert bei Annahme von MTR jede Beobachtung entweder eine informative 
Unter- oder Obergrenze und bei der Annahme von CMTR sowohl eine informa- 
tive Unter- als auch eine informative Obergrenze. 


Bisher wurde noch nicht diskutiert, was mit dieser Verbesserung der Grenzen in 
Kauf genommen werden muss. Während Ginther (2000) die Annahme von MTR 
zur Analyse von Bildungsertragsraten ohne Einschränkungen verwendet, lehnt 
Lechner (1999) diese Annahme? bei der Evaluierung beruflicher 
Weiterbildungsmaßnahmen als zu restriktiv ab, da sie bedeutet, dass das Ergeb- 
nis bei einem größeren Wert der Treatmentvariablen bei keiner Person niedriger 
sein kann als bei einem kleineren Wert. 


Dieser Begründung ist nicht zuzustimmen. Vorausgesetzt man bleibt im Rahmen 
der Humankapitaltheorie, ist mit einer Mehrinvestition auch ein höherer Lohn- 
satz verbunden. Ob dieser auf dem Arbeitsmarkt realisiert werden kann, ist ein 
anderes Problem, das die Verwendung der Annahme an sich nicht in Frage stellt. 


Es wurde des Weiteren gezeigt, dass keine der Annahmen für sich allein ge- 
nommen einen Test der Hypothese erlaubt, dass der Treatmenteffekt gleich Null 
ist. Da immer nur ein Wert der individuellen Responsefunktion, (z sy 


beobachtet werden kann, ist die empirische Evidenz immer konsistent mit der 
Nullhypothese, dass der Treatmenteffekt gleich Null ist. In Abschnitt 3.2.3.2.3 
wurde gezeigt, dass erst die Kombination mit der — isoliert ebenfalls nicht test- 
baren — Annahme exogener Treatmentselektion einen solchen Test der Annah- 
men von MTR bzw. SMTR ermöglicht. 


7? Sowohl Ginther (2000) als auch Lechner (1999) verwenden nur binäre Treatmentvariablen 
und "ordered outcomes". Aus diesem Grund benötigen sie das Konzept der 
Responsefunktionen nicht. 
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3.2.4 Restriktion der Verteilungsfunktion 


Die in den Abschnitten 3.2.2 und 3.2.3 ermittelten Grenzen fiir D-Parameter und 
D-Treatmenteffekte hingen, von der Annahme konkav-monotoner Response- 
funktionen (CMTR) und wenigen Spezialfällen abgesehen, alle mehr oder weni- 
ger stark von der unteren Schranke K, und der oberen Schranke K, ab. Welche 


Ansätze gibt es neben der Annahme konkav-monotoner Responsefunktionen, 
Grenzen für D-Parameter und D-Treatmenteffekte zu bestimmen, die nicht von 
diesen beiden Schranken beeinflusst werden? 


Dazu wird zunächst in den Abschnitten 3.2.4.1 bis 3.2.4.4 untersucht, inwieweit 
allein durch die Verwendung von Instrumentalvariablen, auch Ausschlussre- 
striktionen genannt, und einer abgeschwächten Form, den monotonen Instru- 
mentalvariablen — Übersicht 3.2, Abschnitt 3.2.1 — die Verteilungsfunktion für 
verschiedene Werte t der Treatmentvariablen begrenzt und damit die beiden 
Schranken K, und K, ersetzt werden können. In Abschnitt 3.2.4.5 wird gezeigt, 


dass mit Hilfe des Instrumentalvariablenansatzes nicht nur die Grenzen verbes- 
sert werden können, sondern auch der Selektionsprozess in die Treatments be- 
rücksichtigt werden kann, der in Abschnitt 3.2.3 bei der Analyse der Response- 
funktionen nicht thematisiert wurde. 


In Abschnitt 3.2.5 werden diese Instrumentalvariablenansätze dann mit den Re- 
striktionen der Responsefunktion aus Abschnitt 3.2.3, MTR, SMTR und CMTR 
kombiniert. Dabei ist Abschnitt 3.2.5.3 hervorzuheben, in dem monotone 
Treatmentselektion (MTS) und die Annahme monotoner Responsefunktionen 
(MTR) zu der Annahme von MTS-MTR kombiniert werden. Diese Kombination 
wurde bislang als einzige empirisch auf die Analyse von Bildungsertragsraten 
angewendet und wird deshalb auch besonders ausführlich behandelt.°° 


Bei der Kombination der Annahmen monotoner Instrumentalvariablen (MIV) 
und monotoner Responsefunktionen (MTR) wird auf die Analyse von D-Treat- 
menteffekten verzichtet, da diese im Vergleich zu der Annahme von MIV und 
der Annahme von MTS-MTR, die in der empirischen Anwendung im Vorder- 
grund stehen wird, sehr komplex jet." 


8 Vgl. Manski/Pepper (2000), S. 1005-1009. 
8l Vgl. Manski/Pepper (2000), S. 1005. 
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3.2.4.1 Ausschlussrestriktionen 


Die beobachtbaren Kovariaten w wurden bisher nur zur Definition der interes- 
sierenden Grundgesamtheit verwendet. Im Folgenden wird — wie schon bei der 
Einführung in den Modellrahmen, Abschnitt 3.2.1, erläutert — innerhalb der Ko- 
variaten zwischen zwei Gruppen, w und v, unterschieden. Dabei dient eine 
Variable, die zur Gruppe w gehört, weiterhin der Definition der interessierenden 
Grundgesamtheit. Eine Variable, die zur Gruppe v gehört, soll dagegen die 
Eigenschaft aufweisen, dass ein bestimmter Aspekt der Responsefunktion, bei- 
spielsweise der Erwartungswert, Ely(t}w], für alle Werte u dieser Variablen, 


bedingt auf die durch die Variablen in w definierte Grundgesamtheit, konstant 
ist. Da eine solche Variable damit von der Bestimmung dieses Erwartungswertes 
der Responsefunktion annahmegemäß ausgeschlossen ist, bezeichnet man diese 
Variable als eine Instrumentalvariable bzw. die Verwendung einer solchen Vari- 
ablen als Ausschlussrestriktion. 


In Abschnitt 3.2.1, Abbildung 3.3, wurde die Funktionsweise der Ausschlussre- 
striktion bereits grafisch skizziert. Zur formalen Darstellung sei zunächst verein- 
fachend angenommen, die Instrumentalvariable v habe nur zwei Ausprägungen, 
u, und u,. Da die Instrumentalvariable annahmegemäß von der Bestimmung 
der Ergebnisvariablen ausgeschlossen ist, gilt, dass der Erwartungswert der Res- 
ponsefunktion bei u, mit dem bei u, übereinstimmen muss: 


(3.122) Ely(t)w,u, ]= Ely(t}w,u,| . 


Aus (3.122) folgt nun direkt, dass die Untergrenze des nicht auf die Instrumen- 
talvariable bedingten Erwartungswertes Ely(t)w] nicht kleiner als der größte 


Wert der beiden Worst-Case-Untergrenzen für den bedingten Erwartungswert 
und die Obergrenze nicht größer als der kleinste Wert der beiden Worst-Case- 
Obergrenzen sein kann. 


Somit muss der unbedingte Erwartungswert Ely(t}w] nicht nur im Intervall 


(3.123) der Worst-Case-Grenzen aus Abschnitt 3.2.2 liegen, sondern auch im 
Intervall? (3.124), das sich durch die Instrumentalvariable ergibt. Die Breite 
dieses Intervalls wiederum ist höchstens so groß wie in (3.123). 


#2 Vgl. Manski (1995), S. 37. 
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Ko -P(z  tlw)+ E(ylw,z = t)- P(z = tlw) 
(3.123) < Ely(t}w] 
< K, P(z # t|w)+ E(y|w,z = t): P(z = tlw) 


sup IK, Plz # tlw,u;)+ Elylw,z = Gol Plz = deu. 
j=1,2 


(3.124) < E[y(t)w] 
< m K; Plz = tlw,u, }+ Elylw,z = Gol Plz = den 


Unter Verwendung der Instrumentalvariablen ergibt sich zwar in der Regel ein 
kleineres Intervall, zur Identifikation des unbedingten Erwartungswert GEO DN 
kommt es jedoch nur dann, d.h. die Unter- und Obergrenze fallen nur dann zu- 
sammen, wenn in (3.124) für die größte untere Schranke 
To = sup Plz — iw,u,)= 1 gilt: 

j=1,2 


rk, D = 1)+ Ely}. = suj} | 
(3.125) = Ely(t}w] 


= int -(1-1)+ ch —uuclil 
Hieraus folgt die Identifikation des unbedingten Erwartungswertes:” 


(3.126) sup Elyw,z =t, u,)= Ely(t}w]= i f EN = t,u;) ; 
j=1,2 > 


83 Vgl. Manski (1994b), S. 157. Notwendige Bedingung dafür, dass eine Instrumentalvariable 
zur Identifikation führen kann, ist xg 20,5. Dies kann gezeigt werden, indem die 
größtmögliche Unter- und die kleinstmögliche Obergrenze in (3.124) in Abhängigkeit von 
no bestimmt wird: Kọ D - no)+ K] -Tọ $ e[y(t)w | < Ky D - no )+ Kan, Bildet man 
nun die Differenz zwischen der kleinstmöglichen Ober- und der größtmöglichen 
Untergrenze, erhält man den Ausdruck (k; - Ko} (1-2- aal der für xg <0,5 immer 
positiv und von Null verschieden ist, so dass die Schrumpfung des Intervalls auf einen 
Punkt nicht möglich ist. 


Steffen Wirth - 978-3-631-75476-4 
Downloaded from PubFactory at 01/11/2019 04:32:44AM 
via free access 


101 


Um in den nächsten Abschnitten scharfe Grenzen in Abhängigkeit der beiden 
hier betrachteten Varianten von Instrumentalvariablen® ermitteln zu können, 
wird zunächst definiert, was im Folgenden unter einer IV- und einer MIV-An- 
nahme zu verstehen ist. Die übliche Definition einer Instrumentalvariablen (IV- 
Annahme) im allgemeinen Fall ist: 


Die Variable v sei eine Instrumentalvariablle im Sinne der 
Mittelwertunabhängigkeit (mean-independence), wenn für jedes Treatment 
te T, jeden Wert der Kovariaten w und allen (u,u')e (V x V) gilt: 


(3.127) Ely(t}w, v= ul = SEO D = u'] ; 


Ist dabei die Instrumentalvariable v selbst das realisierte Treatment, v = z, er- 
gibt sich als Spezialfall dieser IV-Annahme die Annahme von ETS aus Ab- 
schnitt 3.1.3.1: 


(3.128) Ely(t}w,z = u] = Ely(t}w,z = u'l, Vv(u,u')e(VxV). 


Wie in Abschnitt 3.2.3 bei der Einführung der Annahme von MTR bereits ge- 
zeigt wurde, kann es modelltheoretische Gründe geben, von dieser [IV-Annahme 
abzuweichen und zu untersuchen, wie sich eine Lockerung der Annahmen auf 
die Identifikation von Parametern auswirkt. Die IV-Annahme wird deshalb zu 
der so genannten MIV-Annahme abgeschwächt: 


V sei eine geordnete Menge. Dann sei die Variable v eine monotone Instrumen- 
talvariable im Sinne der Monotonie im Mittel (mean-monotonicity), wenn für 
jedes Treatment t € T, jeden Wert der Kovariaten w und allen (u,,u,)e(VxV) 


mit u, <u, gilt: 
(3.129) Ely(t}w, v = u,|< Ely(t}w,v = u, | 


Dies sei wieder interpretiert vor dem Hintergrund der Humankapitaltheorie. 
Wenn beispielsweise mit der Kovariaten v die Fähigkeiten einer Person gemes- 
sen werden, besagt die IV-Annahme, dass Personen mit unterschiedlichen ge- 
messenen Fähigkeiten trotzdem exakt dieselbe Durchschnittslohnfunktion auf- 
weisen, während die MIV-Annahme nur impliziert, dass die Durchschnittslohn- 


di Vgl. Imbens (2001) zu weiteren Definitionen von Instrumentalvariablen und Manski 
(1994a). 
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funktionen der Personen mit höheren gemessenen Fähigkeiten mindestens so 
hoch sind wie die Durchschnittslohnfunktionen der Personen mit geringeren 
gemessenen Fähigkeiten. In Abbildung 3.16 ist illustriert, dass die Annahme von 
MIV nicht fordert, dass das Ergebnis mit zunehmendem Wert der Treatmentva- 
riablen steigen muss. Es wird lediglich vorausgesetzt, dass das Ergebnis der Per- 
sonen, die u, Jahre gewählt haben größer ist als das der Personen, die lediglich 


u, Jahre gewählt haben. Erst die Kombination der Annahmen von MIV und 


MTR führt dazu, dass das Ergebnis mit steigendem Wert der Treatmentvariablen 
nicht sinken kann. Dies ist in Abbildung 3.17 dargestellt. 


Abbildung 3.16: Intervalle, MIV Abbildung 3.17: Intervalle, MIV und MTR 


Um die entsprechenden Grenzen für Quantile und Quantil-Treatmenteffekte bei 
einer IV- bzw. MIV-Annahme bestimmen zu können, müssen die beiden gerade 
aufgestellten Definitionen auf die Quantile übertragen werden. 


Eine Kovariate v sei eine Instrumentalvariable im Sinne der Quantilunab- 
hängigkeit (quantile-independence), wenn für jedes Treatment te T , jeden Wert 
der Kovariaten w, allen (u,u')e(VxV) und einem betrachteten o-Quantil 
+1485 
gilt: 


(3.130) qaly(t}w, v = ul = aaly(t}w, v = u'] : 


Die strengste Ausschlussrestriktion im Sinne der Quantilunabhängigkeit wäre, 
dass nicht nur ein bestimmtes a-Quantil über alle Werte der Instrumentalvari- 
ablen hinweg konstant bleibt, sondern dass alle a -Quantile gemeinsam nicht mit 
v variieren. Die beiden Verteilungen wären dann annahmegemäß identisch. 


35 Vgl. Manski (1994b), S. 157. 
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Eine Kovariate v sei eine monotone Instrumentalvariable im Sinne der Monoto- 
nie eines a-Quantils (quantile-monotonicity), wenn für jedes Treatment teT, 
jeden Wert der Kovariaten w, allen (u,,u,)e (V x V) und einem betrachteten o 


gilt: 
(3.131) SE OG DA = u |< qaly(t)w, v = u, | 


Entsprechend wäre hier die strengste Ausschlußrestriktion im Sinne der Quan- 
tilunabhängigkeit, wenn man annehmen würde, dass (3.131) für alle a-Quantile 
gemeinsam gelten würde. Dies würde dem Konzept der stochastischen Domi- 
nanz entsprechen. Die auf den Wert u, der Instrumentalvariablen bedingte Ver- 


teilung würde die auf u, bedingte Verteilung stochastisch dominieren. 


In den folgenden Abschnitten werden die D-Parameter Ely(tJw,v= ul, 
quly{tlw, v = ul, Ely(t}w] und EE OH im Mittelpunkt stehen. Um die Dar- 
stellung zu vereinfachen, wird Ely(t)w] weiterhin als unbedingter Erwartungs- 
wert und EE OG DN als unbedingtes a-Quantil im Sinne von Parametern der 
Responsefunktion bei spezifizierten Kovariaten w bezeichnet, während 
Ely(t}w, v = ul ein bedingter Erwartungswert und aaly(t}w, v = ul ein beding- 
tes a-Quantil genannt wird. 


3.2.4.2 Worst-Case-Grenzen 


Um die Auswirkungen der verschiedenen Annahmen in den folgenden Ab- 
schnitten auf die Grenzen für D-Parameter und D-Treatmenteffekte anhand ei- 
nes Referenzszenarios beurteilen zu können, wird wieder mit der Bestimmung 
von Worst-Case-Grenzen begonnen. Es wird untersucht, welche Grenzen sich 
für den unbedingten D-Parameter D[y(t}w] und nun zusätzlich für den beding- 


ten D-Parameter D|y(t)w, v = u] ergeben, wenn eine weitere Kovariate v einbe- 


zogen wird, ohne dass über diese und über den Verlauf der Responsefunktionen 
zusätzliche Annahmen getroffen werden. 


Zur Bestimmung der Grenzen für den unbedingten Erwartungswert ist es nötig, 
zunächst den bedingten Erwartungswert Ely(tJw, v = ul zu bestimmen. In 


(3.132) wird hierzu die Tatsache verwendet, dass der auf einen Wert u der Ko- 
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variaten v und ein realisiertes Treatment z =t bedingte Erwartungswert empi- 
risch direkt bestimmbar ist: 


(3.132) Ely(t}w, v =u,Z= t|= E(y W,V=U,Z= de 


Zusammen mit dem Gesetz iterierter Erwartungswerte erhält man dann für den 
bedingten Erwartungswert Ely(t}w, v= ul: 


(3.133) Ely(t}w, v = u]= ep ey =u,z = d np Er 


w,v=u 
+Ely(t}w,v=u,z #t|-Plz #t 


w,v=Uu 


Mit Ausnahme des bedingten Erwartungswertes Ely(t)w, v =U,Z# t], der jeden 
Wert aus dem Intervall [K,,K,] annehmen kann, ist jede Größe anhand der 
Stichprobe schätzbar. Mit den Worst-Case-Grenzen aus Abschnitt 3.2 


z#zt>K,<s Ely(t)}w, v =uU,Z# d K; 
SEN A Ely(t)w, v SS Hee d- E(ylw, v SS es t) 

ergeben sich dann die scharfen Grenzen fiir den bedingten Erwartungswert 
Sgegi v= ul: 


Ko ‚Plz #tlw,v= u)+ E(y|w, v =uU,Z= t)- P(z = t|w,v = u) 
(3.135) < Ely(t}w, v= u] 
< K, -P(z # tlw, v = u)+ Ell, v = u,z =t)-P(z = tlw, v =u) 
Die Grenzen in (3.135) kann man nun dazu verwenden, um Grenzen für den un- 
bedingten Erwartungswert Ely(t}w] abzuleiten. Falls die Menge V endlich” ist, 


kann man den unbedingten Erwartungswert mit dem Gesetz iterierter Erwar- 
tungswerte schreiben als 


(3.136) Ely(t}w]= E[y(t}w, v =u]: P(w,v=u) . 


ueV 


86 Vgl. Manski/Pepper (2000), S. 999. 
8” Vgl. Manski/Pepper (2000), S. 1000. Falls V nicht endlich ist, muss ein Lebesgue-Integral 
verwendet werden. 
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Setzt man nun fiir jeden Wert u der Instrumentalvariablen in (3.136) zur Be- 
stimmung der Untergrenze (Obergrenze) von Ely(t)w] die entsprechende Unter- 


grenze (Obergrenze) aus (3.135) ein, erhält man die Grenzen 


2 Plv = ul [K, „Plz # tiv = u)+ E(ylv =u,zZ= t)- P(z = tiv = u)| 


(3.137) < Ely(t)w] 
< GEN =u)-[K, -P(z # tlv =u)+ Elylv =u,z = t): P(z = tv =u) 


Diese Unter- und Obergrenze lassen sich schreiben als: 


Ko: > P(w,v =u). P(z # tlw,v =u) 
ueV 
(3.138) + > P(w,v =u): E(yw,v=u,2=t)-P(lz=tw,v=u) E 
ueV 


= Ky Plz # tlw)+ Ely|w,z = t): P(z = tlw) 


K: F P(w, v =u): P(z # tlw, v =u) 
ueV 
(3.139) + > P(w,v =u): E(ylw,v = u,z = t): P(z = tlw,v = u) 
ueV 


=K. P(z z t|w)+ E(y W,Z= t)- P(z = tlw) 


Damit entsprechen die Grenzen für den unbedingten Erwartungswert Ely(t}w] 
in (3.140) den Worst-Case-Grenzen in (3.24) aus Abschnitt 3.2.2: 


Ko: P(z # tlw) + E(ylw,z = t). P(z = tlw) 
(3.140) < Gë | 
< K, -P(z edel E(ylw,z = t)- P(z = tw) 


Nun wird untersucht, welche Worst-Case-Grenzen sich fiir die Quantile der 
Responsefunktion unter Verwendung einer weiteren Kovariaten ergeben. Ohne 
IV-Annahme ergeben sich für das bedingte a -Quantil SEO A = ul die fol- 


genden Worst-Case-Grenzen in Analogie zu Abschnitt 3.2.2.1: 


w,v=u) : 


3.141) q,,(ylw,v=u)<q,ly(thw, v =u]< q, D 
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wobei die Grenzen q}, (ylw, v = u) und q,, (ylw, v = u) ebenfalls entsprechend 
Abschnitt 3.2.2.1 in den Bereichen” 


0 <a < P(z#tlw,v=u)=> Ky <q, 
P(z = tw,v =u <a< 1 = gu SK, 
P(z#tlw,v=u)<a< 1 => da, S qa 

0 <as P(z=t|w,v=u)> as, 


(3.142) Plz=tw,v=u)<a<Plz#tw,v=u)>K,<q,<K, 
P(z#tlw,v=u)<a< P z=tw,v=u)> d, Ś da SA, 


bestimmt werden mit: 


a — P(z + t|w,v =u) 


3.143) A = 
oa) "9 P(z = tlw,v =u) 


H 


Q 


3.144) Aus . 
nz P(z=tjw,v=u) 


Für das unbedingte a -Quantil qaly(t)w] können wieder die Grenzen aus Kapi- 


tel 3.2.2 übernommen werden. Dies entspricht auch der Intuition, da von den auf 
die Kovariate bedingten Grenzen keine wechselseitigen Restriktionen ausgehen, 
die sich auf die Grenzen für den unbedingten Erwartungswert auswirken könn- 
ten. 


Verwendet man also eine zusätzliche Kovariate ohne zusätzliche Annahmen zu 
treffen, verändert dies weder die Worst-Case-Grenzen für den unbedingten Er- 
wartungswert noch für die unbedingten Quantile. Damit gelten aber auch die 
Grenzen für die D-Treatmenteffekte aus Kapitel 3.2.2. Um engere Grenzen für 
die Parameter und die Treatmenteffekte bestimmen zu können, wird im nächsten 
Abschnitt die eingangs schon besprochene Ausschlussrestriktion ausführlich 
dargestellt. 


° Auf die Kovariate V bedingte Quantile da ly(tw.v =u] > Mg (y\w,z =t,v =u) sowie 


dÉ (y w,z=t,v=u) werden aus Vereinfachungsgründen kurz als qg , dÉ und d 


geschrieben. 
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3.2.4.3 Instrumentalvariablen (IV) und Worst-Case-Grenzen 


In diesem Abschnitt wird für die zusätzlich eingeführte Kovariate angenommen, 
dass sie die Eigenschaften einer Instrumentalvariablen erfüllt. Mit der Definition 
einer Instrumentalvariablen (3.127) aus Abschnitt 3.2.4.1 ergeben sich dann — 
wie schon im Einführungsbeispiel skizziert — im Vergleich zu den Worst-Case- 
Grenzen in Abschnitt 3.2.4.2 in der Regel engere Grenzen.” Dies gilt sowohl für 
den bedingten Erwartungswert Ely(t}w, v= ul und daraus folgend fiir den unbe- 


dingten Erwartungswert Ely(t)w] als auch für die bedingten und unbedingten 
Quantile. 


Da aufgrund der IV-Annahme der bedingte Erwartungswert Ely(t)w, v = ul in 


(3.145) nicht kleiner als der größte Wert der Worst-Case-Untergrenze und nicht 
größer als der kleinste Wert der Worst-Case-Obergrenze sein kann, gilt”: 


sup|K, -P(z #tw,v= u)+ Elle, v =U,Z= t)- P(z =tlw,v= u)] 
ueV 
(3.145) < Ely(t}w,v =u] 
< inf[K, -P(z #tw,v= u)+ E(ylw,v =uU,Z= t)- P(z = tlw, v = u)] 


Verwendet man nun diese engeren Grenzen (3.145) für die bedingten Erwar- 
tungswerte in (3.133) anstelle der Worst-Case-Grenzen (3.135) im vorigen Ab- 
schnitt, ergeben sich die Grenzen für den unbedingten Erwartungswert 


GEO OM als 


GEN VW | 


ueV ueV + E(ylw,v =u,z =t)-P(z=t 
(3.146) < Ely(t}w] 
_ [K Plz#tw,v=u) 
< P =u)-2inf 
` 2% ne) ee DEEN 
bzw. 


8 Vgl. Manski (1990), S. 322f. 
°° Vgl. Manski/Pepper (2000), S. 1000, und Manski (1995), S. 37. 
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w,v=u)| 


W,V=u,z=t)-P(z=t 


sup[K, - Plz = tlw, v =u)+ Ely 
ueV 


(3.147) < Ely(t}w] 
< inf|K, -P(z # tlw, v = u)+ Elle. v = u, z = t)- Plz = tlw, v= all 
Wenn der bedingte Erwartungswert E(ylw, v=zuZ= t) bei verschiedenen Wer- 


ten von t variiert, sind die Grenzen in (3.145) für die Untergrenze größer und für 
die Obergrenze kleiner. Das Intervall, in dem der unbedingte Erwartungswert 
liegt, fällt dann entsprechend enger aus. 


Mit der Annahme der Quantilunabhängigkeit”' erhält man die Worst-Case-Gren- 
zen für das bedingte Quantil qaly(t}w, v= ul. Dieses kann nicht kleiner sein als 


w,v= u) VueV und nicht größer als der kleinste 


der größte Wert von q,, (y 
Wert von q,, HEN v= u) Vue V wobei zu beachten ist, dass sich die Werte für 


Ao (A,) bei verschiedenen u unterscheiden werden: 


(3.148) sup qi, (ylw,v = u)< qaly(t)w, v = u] < inf A, (ylw,v = u) 


Die Untergrenzen q}, (y w,v= u) und die Obergrenzen q,, (ylw, v = u) werden 
dabei wie in (3.142) und A, bzw. A, wie z.B. in (3.143) und (3.144) bestimmt. 


Für ein unbedingtes Quantil qaly(t)w] folgt damit direkt aus der Annahme der 
Quantilunabhängigkeit (3.130): 


(3.149) sup da, (ylw,v=u)s SEO CHE inf qa, (ylw, v =u) . 


Da die Grenzen Diy(t, Jw, v = ul und Diy(t, Jw, v = ul für den Erwartungswert 
und die Quantile scharf sind und es gleichzeitig möglich ist, dass 
Dal, }w, v= ul seinen maximalen (minimalen) Wert und Diy(t, jw, v= u] sei- 
nen minimalen (maximalen) Wert annimmt, ergibt sich die Obergrenze (Unter- 
grenze) für die D-Treatmenteffekte Diy(t, ni Dat, }w] aus der Differenz 


"TT Vgl. Manski (1994b), S. 157. 
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der Obergrenze (Untergrenze) fiir Datt, Jw] und der Untergrenze (Ober- 
grenze) für D[y(t, }w].” 


Nachdem nun die Worst-Case-Grenzen fiir bedingte und unbedingte Erwar- 
tungswerte sowie Quantile bei Annahme einer Instrumentalvariablen untersucht 
wurden, wird die IV-Annahme im nächsten Abschnitt zu der MIV-Annahme 
abgeschwächt. 


3.2.4.4 Monotone Instrumentalvariablen (MIV) und Worst-Case-Grenzen 


Welche Änderungen ergeben sich nun durch die Abschwächung der IV-An- 
nahme”? In Abbildung 3.4, Abschnitt 3.2.1, wurde bereits gezeigt, dass das Inter- 
vall dadurch in der Regel größer wird, da bei der Bestimmung der Unter- bzw. 
Obergrenze bei Annahme monotoner Instrumentalvariablen jeweils nur ein Teil 
der Werte der Instrumentalvariablen verwendet wird. 


Aus der Annahme monotoner Instrumentalvariablen (3.129) folgt nun direkt die 
Ungleichung für den bedingten Erwartungswert Ely(t)w, v= ul: 


(3.150) u,;susu,> Ely(t}w,v = u,|< Ely(t}w, v = ul < Ely(t)w, v = u, | ; 


Dies bedeutet, dass der bedingte Erwartungswert nicht kleiner sein kann als die 
Worst-Case-Untergrenze von Ely(t)w, v = nl und nicht größer als die Worst- 
Case-Obergrenze von E[y(t}w,v =u, |. Er liegt damit wieder im gemeinsamen 
Bereich der größten unteren und der kleinsten oberen Grenze, wobei wegen der 
Monotonie nun das Supremum und das Infimum nicht mehr wie bei der IV-An- 
nahme über alle Werte u der Instrumentalvariablen v bestimmt wird, sondern 
wegen (3.150) jeweils die Teilbereiche u, <u und u, 2u verwendet werden 
müssen. Mit der MIV-Annahme erhält man daher für jeden Wert u der Instru- 
mentalvariablen u € V die scharfen Grenzen für den bedingten Erwartungswert 
Ely(t}w, v = ul: 


"7 Vel. Manski/Pepper (2000), S. 1005. 
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sup|K, P(z #t 


u; Su 


WV u,)+ E(ylw,v =U,,Z= t). P(z = tw, v = u,)| 

< Ely(t)w, v =ul 

< inf [K, -P(z + tlw,v= u, )+ E(yjw, v =U,,Z= d P(z =t 
u,2u 


2 


(3.151) 
W,v= u, )| 


Da die Unter- und Obergrenzen für den bedingten Erwartungswert 
Ely(t)}w, v = ul bei der MIV-Annahme in u annahmegemäß schwach monoton 


steigen, erhält man die scharfen Grenzen für den unbedingten Erwartungswert 
Ely(t}w], indem man jeden Wert von Ely(t)w, v = ul, ue V, in der Darstel- 


lung von GË D OM in (3.136) jeweils durch die entsprechende Unter- bzw. 
Obergrenze ersetzt: 


Ko KÉ #tlw,v=u,) 
p =u} 
2 ey fe E(y|w, v =U,,Z= t)- Plz =tiw,v A 


(3.152) < Elte 
E l K, -P(z # tlw, v=u,) 


Nun soll untersucht werden, welche Spezialfälle sich ergeben, wenn die Grenzen 
für den bedingten Erwartungswert monoton steigen oder monoton fallen. 


Die MIV- und die Worst-Case-Grenzen fallen genau dann zusammen, wenn die 
Worst-Case-Grenzen von Ely(t}w,v = u] schwach monoton in u steigen, da 
dann in den Grenzen (3.152) das Supremum für u, =u und das Infimum für 
u, =u gegeben ist: 


| sup[K, P(z z tlw,v = u,)+ Elle A SE t). P(z = tlw, v = u 
u Su 


= [K, -P(z # tiw,v = u)+ E(ylw,v =U,Z= d P(z = tiw, v = u)] 
(3.153) < Ely(t}w,v =u 
inf IN -P(z + tlw,v= u,)+ Eller. =U,,Z= d P(z =tlw,v= u,) 
< UEEAI 
= [K, Plz # tlw, v = u)+ E(ylw,v =u,Z= d P(z = tlw, v = u) 
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In diesem Fall ergibt sich durch die MIV-Annahme gegentiber der annahmen- 
freien Bestimmung der Grenzen keine zusätzliche Identifikationskraft. 


Die MIV- und IV-Grenzen fallen in dem anderen Extremfall zusammen, in dem 
die Worst-Case-Unter- und Obergrenzen von Efy( (t)w,v= u] schwach monoton 


in u fallen. Dann hat es keine Auswirkungen mehr, dass zur Bestimmung des 
Supremums und des Infimums jeweils nur ein Teil des Wertebereichs der In- 
strumentalvariablen verwendet wird. Es gilt dann für den bedingten Erwar- 
tungswert: 


sup|K, P( 
ueV 


=u)] 


)+ Elylw,v = u,z =t): P(z = 


(3.154) =Ely(tJw,v=u] 


= inf[K, PL )+ B(y|w,v =u,,z=t)-P(z = tw, v =u, )] 


Fiir den unbedingten Erwartungswert Ely(t}w] ergeben sich dann wieder die 
IV-Grenzen (3.147) aus Abschnitt 3.2.4.3. 


Abschließend wird in diesem Abschnitt untersucht, welche Grenzen sich im 
Worst-Case-Szenario für die bedingten und unbedingten Quantile unter Berück- 
sichtigung einer monotonen Instrumentalvariablen ergeben. 


Aus der MIV-Annahme für die Quantile folgt direkt die Ungleichung 

(3.155) „susu, > a, bla. v = u,|< quly(t)w, v = ul< q.ly(t)w, v = u, | 
und damit die Bestimmung der Grenzen des bedingten «-Quantils 
DE ON v= ul mit 


=. 


(3.156) supq,, ( 


usu 


dea dene int a, 


Für das unbedingte a-Quantil qaly(t)w] ergibt sich dann als Intervall 


(3.157) supl sup a, (yw, 


ueV| uj; Su 


=»)|-acby@)w]s in| i inf q,, (ylw,v = d . 
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3.2.4.5 Monotone Treatmentselektion (MTS) 


Welche Konsequenzen ergeben sich bei der Annahme monotoner Instrumental- 
variablen für die Grenzen für den Spezialfall, dass die Instrumentalvariable 
selbst das realisierte Treatment darstellt? 


In Abschnitt 3.2.4.1 wurde bereits gezeigt, dass sich bei Verwendung der IV- 
Annahme (3.127) genau dann der Fall exogener Treatmentselektion (ETS) er- 
gibt, der bereits in Abschnitt 3.1.3.1 behandelt wurde. 


Die Annahme von ETS stellt den Ausgangspunkt dar, um die Unterschiede aus- 
führlich herauszuarbeiten. Für die bedingten Responsefunktionen in (3.158)” 
gilt bei der Annahme von ETS: 


(3.158) Ely(t}w,z = u, |= Ely(tJw,z=u;]| . 


Durch die Annahme monotoner Instrumentalvariablen in (3.159) wird dies in 
eine Ungleichung abgeschwächt: 


T sei eine geordnete Menge von Treatments t. Für jedes Treatment te T wird 
nun angenommen: 


(3.159) u, Su, > Ely(t)|w,z = u, |< Ely(t)lw,z=u,] . 


Diese Abschwächung der Annahme von ETS bezeichnen Manski/Pepper (2000) 
als "Monotone Treatment Selection" (MTS). Auf die Humankapitaltheorie 
übertragen besagt die Annahme, dass die Durchschnittslohnfunktionen von Per- 
sonen, die ein höheres Bildungsniveau wählen, mindestens so groß sind wie die 
Durchschnittslohnfunktionen der Personen, die weniger Zeit in Bildung investie- 
ren. Sie ist damit im Unterschied zur Annahme von ETS mit Modellen verträg- 
lich, die fordern, dass Personen mit größeren Fähigkeiten höhere Durch- 
schnittslohnfunktionen besitzen und daher mehr Zeit in Bildung investieren als 
Personen mit geringeren Fähigkeiten. 


Das einzige ökonomische Argument gegen die Annahme monotoner Treatment- 
selektion in Bezug auf Lohnfunktionen wurde bisher von Card” vorgebracht. Er 


" Vgl. Manski/Pepper (2000), S. 1001. 
4 Vel. Card (1995), S. 32ff. 
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schließt nicht aus, dass Fähigkeiten und die Wahl, wie viel Zeit in Bildung in- 
vestiert werden soll, negativ korreliert sind. 


Die Annahme monotoner Treatmentselektion (MTS) ist damit inhaltlich von der 
Annahme monotoner Responsefunktionen (MTR) abzugrenzen. Vor dem Hin- 
tergrund der Humankapitaltheorie bezieht sich die Annahme von MTR auf den 
Verlauf der Lohnfunktion jeder einzelnen Person und besagt, dass diese Lohn- 
funktion mit steigender Anzahl an Bildungsjahren schwach monoton steigt. Da- 
gegen sagt die Annahme von MTS nichts tiber den Verlauf der individuellen 
Responsefunktionen aus und fordert nur, dass die Durchschnittslohnfunktionen 
der Personen, die ein höheres Bildungsniveau gewählt haben, größer sind als die 
Durchschnittslohnfunktionen der Personen, die ein geringeres Bildungsniveau 
ausgewählt haben. 


Für die Verwendung der Annahmen im Rahmen der Humankapitaltheorie lässt 
sich das Fazit ziehen, dass die Annahme von MTS mit ökonomischen Modellen 
kompatibel ist, die sich mit der individuellen Wahl des Bildungsniveaus be- 
schäftigen, und die Annahme von MTR mit Modellen, die sich mit der Produk- 
tion von Humankapital durch Investitionen von Individuen in Bildung auseinan- 
der setzen. Obwohl sich die beiden Annahmen damit im Hinblick auf die 
Interpretation der Aussage "Löhne steigen mit der Anzahl an Bildungsjahren" 
deutlich unterscheiden, schließen sie sich nicht gegenseitig aus, sondern 
ergänzen sich sehr gut. Im Abschnitt 3.2.5.3 wird gezeigt, wie beide Annahmen 
kombiniert werden können, um die Grenzen der D-Parameter und der D- 
Treatmenteffekte weiter zu verbessern. Wie in den Abschnitten 3.2.2 und 3.2.3 
werden zunächst in Abschnitt 3.2.4.5.1 Grenzen für D-Parameter bestimmt, um 
diese dann bei der Bestimmung der D-Treatmenteffekte in Abschnitt 3.2.4.5.2 
zu verwenden. 


3.2.4.5.1 Scharfe Grenzen für D-Parameter 


Bevor untersucht wird, welche Restriktionen sich durch die Annahme von MTS 
für die individuellen Responsefunktionen ergeben, wird die Annahme von MTS 
in (3.159), die für den Mittelwert formuliert war, für D-Parameter formuliert: 


T sei eine geordnete Menge von Treatments t. Für jedes Treatment te T wird 
dann angenommen: 


(3.160) u, <u, > Djytt)lw,z = u, |< D[y(t)|w,z=u,] . 
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Damit erhält man folgende Grenzen für die bedingten D-Parameter 
D|y(tJw,z = u] der Responsefunktion: 


u<t> Ky < Di (tw, z=ul < Diy =t) 
(3.161) u=t> DIy( (t)w,z = ul= D(ylw, Z= t) 
u>t> D(y = t)< Dall, Z= ul < K, 


Ausgangspunkt der folgenden Überlegungen ist der Spezialfall, dass das ge- 
wählte Treatment gleich dem betrachteten Treatment, also u =t, ist. Da das rea- 
lisierte Treatment selbst die Instrumentalvariable ist, entspricht der bedingte D- 
Parameter der Responsefunktion D|y(t}z = u] dem D-Parameter der Verteilung 


der Personen, die das Treatment t gewählt bzw. realisiert haben, D(ylz = = t). 


Dieser D-Parameter ist dann wegen (3.160) gleichzeitig die Obergrenze für den 
bedingten D-Parameter der gewählten Treatments, die kleiner als der 
betrachtete, u <t, sind und die Untergrenze des bedingten D-Parameter der 
gewählten Treatments, die größer als der betrachtete, u > t, sind. Für u <t stellt 
K, wieder die Untergrenze, für u >t stellt K, die Obergrenze dar. 


Auf die bedingten Erwartungswerte Ely(t}w,z =u] angewandt, ergeben sich 
die Grenzen: 


u<t> K <« Ely(t}w,z =u] < E(y|w,z =t) 
(3.162) u=t> Ely( (t}w, Z= ul= E(ylw, Z= t) 
u>t> E( E t)< Ely(t}w, z= u] < K, 


Ubertragen auf Lohnfunktionen bedeutet die Annahme von MTS, dass 


als Untergrenze fiir Ely(t)w, Z= u] 
e allen Personen, die weniger als t Jahre Bildung gewählt haben, 
das Supremum K, zugeordnet, 
e allen, die mindestens t Jahre gewählt haben, 


der Erwartungswert E( = t) zugeordnet wird; 
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als Obergrenze für Ely(t}w,z = ul 


e allen Personen, die mehr als t Jahre Bildung gewählt haben, 
das Infimum K, zugeordnet, 
e allen, die höchstens t Jahre gewählt haben, 


W,Z= t) zugeordnet wird. 


der Erwartungswert E(y 


Daraus ergibt sich die Untergrenze (Obergrenze) für die Durchschnittslohnfunk- 
tion GEO DM als gewogenes arithmetisches Mittel von K, (K,) und dem be- 


dingten Erwartungswert E(y|w,z =t), wobei das Infimum K, (Supremum K,) 
mit dem Anteil derjenigen Personen gewichtet wird, die weniger (mehr) als t 


Bildungsjahre gewählt haben, und dem bedingten Erwartungswert E(y W,Z= t) 


mit dem Anteil derjenigen Personen gewichtet wird, die mindestens (höchstens) 
t Bildungsjahre gewählt haben: 


K, -P(z< t\w)+ E(y|w,z = t): P(z > tw) 
E y(t}w 
K, -P(z > tiw)+ Ely|w,z = t): P(z < t}w) 


(3.163) 


IA IA 


Auch bei der Annahme von MTS ergeben sich Vereinfachungen dieser Grenzen, 
wenn das kleinste und das größte Treatment betrachtet werden. 


Für das kleinste Treatment t „in ergibt sich wegen P(z < tinin|W) = 0 die Verein- 


fachung, dass die Untergrenze von Ely(t min Jw] nicht mehr von Ky, sondern nur 


n 


noch von dem bedingten Erwartungswert E(y W,Z= tmin) abhängt: 


(3.164)  B(y|w,Z = tmin) < Blat Jul - 


Für das größte Treatment t,,, ergibt sich wegen P(z >t lw) = 0 die Verein- 


max 


fachung, dass die Obergrenze von Ely(t nox Jw] nicht mehr von K,, sondern nur 
noch von der empirischen Evidenz abhängt: 


(3.165) Ely(tnax w]< Elylw,z = tmax) 
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Im Unterschied zu MTR wird jedoch als empirische Evidenz nicht der unbe- 
dingte Erwartungswert E(ylw), sondern der auf z=t,,, bzw. Z= tmin bedingte 


Erwartungswert E(ylw,z=t,..) bzw. E(ylw,z = tmin ) verwendet. 


Damit unterscheidet sich die Untergrenze (Obergrenze) bei MTS im Unterschied 
zu MTR umso mehr vom Supremum (Infimum) je näher t an t 


min (t nax $ 


In Analogie zu der Bestimmung der Grenzen für den Erwartungswert sollen nun 
Grenzen für die Quantile der Responsefunktion a, battle) abgeleitet werden. 


Statt Ely(t\w,z =u, |=Ely(tJw,z=u, | , der Abschwächung der Mittelwert- 


unabhängigkeit, wird nun entsprechend SEO DE = u,]= SEO D = u, | : 
die Quantilunabhängigkeit, , zur Monotonie im Quantil gelockert: 


=. 


3.16) u <u, > qa lyw, z =u] qay 


Daraus ergeben sich entsprechend zur Durchschnittsfunktion die Grenzen für die 
bedingten Quantilfunktionen qa ly(t)z = ul: 


u<t> K < KÉ =u] <q.(ylz=t) 
(3.167) u=t> qaly(t)\z = ul=q, (yz =t) 
u>t>q,(ylz=t)< daly(t)z =u < Kı 


Wie in Abschnitt 3.2.5.6.3 gezeigt wird, erhält man damit für die unbedingte 
Quantilfunktion q,[y(t)] die Grenzen”: 


D <as ` ; => K, <agly(t)]<a,,(yz=t) 
uU, a, (yz = t)< aaly(t)]< a, (yz =t) 


3.168a 
Se PEH cac 
3.168c 


"7 Die Grenzen wurden auf der Basis persönlicher Korrespondenz mit Prof. C.F. Manski 
entwickelt. 
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aP(z < t|w)— P(z < tlw) 
P(z = tlw 
_ aP(z 2 tw) 


Ein Vergleich des nichtinformativen Bereichs fiir die Untergrenze be1 MTS in 
(3.168) mit dem nichtinformativen Bereich der Worst-Case-Grenzen in (3.25) 
zeigt, dass der nichtinformative Bereich verkleinert und damit der informative 
Bereich vergrößert wird, da (3.171) für a <1 erfüllt ist. 


(3.169) A, = 


P t 
Gm) Si) < pfe) e Ple < tn) P= tn P< tn) Pest) 


Gleichzeitig ist A, = [aP(z < t|w)— P(z < de UU Pis = tlw) - wie in (3.172) gezeigt 
wird — bei MTS auch größer als 4, =[a— Plz # tlw)|/P(z = t|w) im Worst-Case- 
Fall. Da in beiden Varianten die Untergrenze über das q, -Quantil der Ver- 
teilung P(ylz = t) bestimmt wird, ist für a <1 die Untergrenze bei MTS immer 
größer als im Worst-Case-Fall: 


aP(z < t)- P(z<t) a—P(z +t) 
Pis =t) P(z =t) 
(3.172a) < aP(z < t)-P(z <t)>a-P(z +t) 
© aPlz<t)-P(z<t)>a-1+Plz=t)&P(z>t)>aP(z>t) 


Für die Obergrenze folgt analog, dass der informative Bereich vergrößert wird 


P(z=t) 


(3.172b) P(z=t)< Geen 


<> P(z =t)P(z>t)< P(z=t) , 


und das q,, -Quantil der Verteilung P(ylz = t) bei MTS kleiner ist als im Worst- 
Case-Fall, da 


aP(z > tw) 


(3.173) en. 
P(z = tlw) P(z = tlw) ` 
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Auch bei den Quantilen ergeben sich Spezialfalle, wenn das kleinste und das 
größte Treatment, tmin und Les betrachtet werden. Unter- und Obergrenze sind 
bei der Annahme von MTS gleichzeitig informativ, wenn gilt: 


(3.174) Lu 0<a<Plz=tw) , 
(3.175) trex: P(z<tlw)<a<l . 


Wie in Abschnitt 3.2.5.6.4 gezeigt wird, ergeben sich bei Annahme von MTS 
und strikter stochastischer Dominanz die folgenden Grenzen fiir die unbedingte 
Quantilfunktion q, [yew] i 


(3.176a) 0 <asP(z<t)> K, <qlytlsq (vlz=t 
(3.176b) P(z<t)<a<P(z<t)>q,, (ylz=t)<q.lyt)lsq, (ylz=t) 
3.1766) Past)<a< 1 =>q, (ylz=t)<q,lyl< E 


A, und A, werden nun bestimmt mit: 


_a-P(z<tWw) a-Plz<tw) 


3.177) Ag = eo), 
pe P(z > tw) 1- P(z < tlw) 
2178) EE 

i ) i P(z < tlw) 


Durch die strikte stochastische Dominanz werden die nichtinformativen Berei- 
che fiir die Unter- und Obergrenze kleiner, da mit (3.176a) und (3.168a) für die 
Unter- bzw. (3.176c) und (3.168c) fiir die Obergrenze gilt: 


Untergrenze: P(z<t)< Ge , 
Pz=t) pst) 
Obergrenze: Be nn P(z = t)< [P(z < t)+ P(z = t)|[P(z > t)+ P(z = t) 
&0<P(z< Dr > t) 


Gleichzeitig ist auch A, = [a - P(z < t)|/P(z 2 t) — wie im Folgenden gezeigt 
wird — bei MTS mit strikter stochastischer Dominanz größer als 
A, =|aP(z<t)-P(z<t)/P(z=t) bei MTS. 
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aplz<t)-Plz<t)_ a-Plz<t) 
z=t) P(z >t) 


ru 


© 0 < aP(z = t)+ P(z < t)P(z > t)- P(z < t)P(z = t)- aP(z < t)P(z2t) 
< 0< aP(z = t)+ P(z < t)P(z > t)—aP(z < t)P(z 2 t) 
& 0< aP(z = t)+ P(z < t)P(z >t) 

- alP(z=t) + Pfz = t)P(z Cla P(z=t)P(z>t)+P(z<t)P(z>t)] 
<> 0 < aP(z = tl - P(z = t)]+ P(z < t)P(z > t1 - a)- aP(z = t{P(z +t) 
© 0<P(z<t)P(z>tXl-a) 


Für die Obergrenze gilt analog, dass A, = a/P(z< t|w) bei MTS mit strikter sto- 
chastischer Dominanz kleiner ist als A, = [aP(z 2 t|w)|/P(z = tlw) bei MTS: 


a aP(z > tw) 


SÉ del" Pest) S EEE 


3.2.4.5.2 Informative Bereiche 


Die Grenzen bzw. die verschiedenen informativen und nichtinformativen Berei- 
che bei Annahme von MTS mit strikter stochastischer Dominanz sollen — wie 
schon bei der Annahme von MTR - anhand des Eingangsbeispiels exemplarisch 
verdeutlicht werden. Dazu wird das Treatment t=12, aus Darstellungsgründen 
für die Untergrenze das 55%-Quantil und für die Obergrenze das 70%-Quantil 
betrachtet. 


Die Untergrenzen in Abhängigkeit der realisierten Treatments für das unbe- 
dingte qo ss |y(12)Iw ]-Quantil sind gemäß (3.167): 


z<12: Ko 
z=12: a, (ylw,z = 12) 
z>12: an, (yiw,z = 12) 


Daraus folgt allgemein, dass für oz P(z < EEN K, die Untergrenze, fir 
a> P(z < 12|w) das bedingte Quantil o, (ylw,z = 12) die Untergrenze darstellt. 
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_ 0,55 — 0,5 -01, 
1-0,5 

dass die Untergrenze über das 10%-Quantil der Verteilung bei z=12 bestimmt 

wird. Für die 50% Personen, die ein realisiertes Treatment kleiner als 12 aufwei- 

sen, wird K, als Untergrenze angenommen, so dass die fehlenden 5% über das 

10%-Quantil der Verteilung der Personen, die genau 12 Jahre realisiert haben, 

bestimmt werden. 


Für a=0,55, t=12 und P(z < 12|w) = 0,5 gilt dann wegen A, 


Die Obergrenzen in Abhängigkeit der realisierten Treatments für das 
do: [y12)|w]-Quantil sind gemäß (3.167): 


z<12: qa, (ylw,z =12) 
z=12: q,(ywz=12) 
z> 12: K 

l 


Daraus folgt allgemein, dass für a >1-P(z > 12\w) K, die Obergrenze, fiir 
a<1-P(z>12]w) das bedingte Quantil q,, (y 
stellt. 


W,Z= 12) die Obergrenze dar- 


Für a=0,70, t=12 und P(z < EEN =0,76 gilt dann wegen 
We 0,76 — 0,06 

0,76 
lung bei z =12 bestimmt wird. Für die 24% Personen, die ein realisiertes Treat- 
ment größer als 12 aufweisen, wird K, als Obergrenze angenommen, so dass die 
"fehlenden" 6% über das 92,1%-Quantil der Verteilung der Personen, die genau 
12 Jahre realisiert haben, bestimmt werden. 


= 0,921, dass die Obergrenze über das 92,1%-Quantil der Vertei- 


Bei der grafischen Darstellung der verschiedenen Fälle anhand des Einfüh- 
rungsbeispiels mit Kọ =0 und K, =100 wird aus Darstellungsgriinden wieder 
eine stetige Rechteckverteilung in [10 : 90] für die bedingte Verteilung von y 
gewählt. 
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Tabelle 3.6: Quantilfunktionen in den informativen Bereichen, MTS 


Quantilfunktion im Quantilfunktion im 
informativen Bereich der informativen Bereich der 
Untergrenze Obergrenze 


)=80-a+10 


gemeinsamer informativer Bereich Ky 


0 4 3 5 7 9 1 
Qa 
Zuerst werden wieder die Grenzen fiir das kleinste Treatment t =9 betrachtet. 


Für dieses ist P(z 2 glo = 1 und deshalb die Untergrenze immer informativ, d.h. 
von K, verschieden. Je größer hier P(z = ow), umso größer der informative 


Bereich der Untergrenze und damit der gemeinsame informative Bereich. Für 
das Treatment t=12, das zwischen dem kleinsten und dem größten Treatment 
liegt, treten alle drei Bereiche (a)-(c) in (3.176) auf. Je größer P(z = EEN 
umso größer der gemeinsame informative Bereich. 
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Abbildung 3.19: Bereiche der Quantilfunktion, MTS, t =12 


100 
90 


0 1 3 5 7 9 1 


a 
Abbildung 3.20: Bereiche der Quantilfunktion, MTS, t=13 


gemeinsamer informativer Bereich 


0 A 3 5 ‚7 9 1 


a 
Für das größte Treatment t=13 gilt Plz <13|w)= 1, weshalb (3.176a) nicht 
relevant und die Obergrenze deshalb immer informativ ist. Je größer P(z = 13), 
umso größer der gemeinsame informative Bereich: 
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3.2.4.5.3 Scharfe Grenzen fiir D-Treatmenteffekte 
Im Unterschied zu dem D-Treatmenteffekt bei Annahme von MTR erhält man 
bei der Annahme von MTS nicht 0 bzw. D(0) als Untergrenze, sondern wie 


schon im Worst-Case-Fall die Differenz zwischen der Untergrenze des Erwar- 
tungswertes bei t, und der Obergrenze des Erwartungswertes bei t,. 


AD -Treatmenteffekte: 

(3.179) Dy )J- Diy: (t,)] < Du )I- Dale, )]< Diy, (t, )]- Dlyo(t,)] 
DA -Treatmenteffekte: 

(3.180) Dlyo(t.)—y,(t,)]s Dal Late HS Diy, (t2)- yoltı)] 


Abbildung 3.21: Maximal mögliche Untergrenze des durchschnittlichen Treat- 
menteffekts 


y 
i | K ee 
i BG = t,) 
ı Widerspruch 


ti t, t, t 


max 


Bevor gezeigt wird, dass die Annahme von MTS nicht stark genug ist, das Vor- 
zeichen des Treatmenteffekts zu identifizieren, soll Abbildung 3.21 die Ursache 
für diesen Unterschied verdeutlichen. Bei der Annahme von MTR wird im Ge- 
gensatz zu beiden Varianten der Annahme von MTS der mittlere Bereich in Ab- 
bildung 3.21 ausgeschlossen, der für das negative Vorzeichen des Treat- 
menteffektes sorgen kann. 
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Um zu zeigen, dass durch die Annahme von MTS das Vorzeichen nicht identifi- 
ziert werden kann, wird in der Differenz zwischen der Untergrenze des Erwar- 
tungswertes bei t, und der Obergrenze des Erwartungswertes bei t, 


= t] durch K, ersetzt, um die größtmög- 


W,Z= 
liche Untergrenze zu erhalten: 


K,-P(z<t,)+ Elylz = t, |- P(z >t, )-K,-P(z> t, )- Elle = t|- Pz <t), 


K,-P(z<t,)+K,-P(z>t,)—K,-P(z>t,)-K,-P(z<t,) 
=K,-P(t,; <z<t,)—K, -P(t, <z<t,)=(K, —K,)-P(t; <z<t,)<0 ` 


Die Untergrenze des durchschnittlichen Treatmenteffekts ist demzufolge 
höchstens 0. Führt man dasselbe mit der Obergrenze durch, erhält man das Er- 
gebnis, dass diese immer mindestens 0 ist. Unter- und Obergrenze können also 
nur dann zusammenfallen, wenn der Treatmenteffekt identifiziert und gleich 0 
ist. Das ist — von dem trivialen Fall K) = K}, einer Einpunktverteilung, abge- 


sehen — nur dann möglich, wenn P(t, <z<t,)=0 ist, und die bedingten Erwar- 
tungswerte Elylz=t,|und Ely|z = t,] K, bzw. K, entsprechen. 


Als Obergrenze erhält man für den durchschnittlichen Treatmenteffekt 
(3.181) K,-P(z>t,)+Elylz=t,)-P(z<t,)-K,-P(z<t,)- Elylz=t,)-P(z>t,) 


bzw. umgeformt, um später den Vergleich mit anderen Annahmen zu erleich- 
tern, 


= oe = e = = dé <Z< d 
+ {Ely =t, Ely|w,z = t -P(z =t,|w 
"TT ie = ta) Ehel del 
+|E(y )-Kol-Pla<t del IK, EE J|- PE > taw) 


Dies ergibt für die Obergrenze mit Elyiz = A =K, und Elylz = A = K, die 

maximale Breite: 

(3.183) K,-P(z>t,)+K,-P(z<t,)—K,-P(z<t,)-K,-P(z>t,)=K,—Ky 
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Der Aq-Treatmenteffekt hängt vom betrachteten a-Quantil ab. Ist bei einem 
gegebenen a sowohl die Untergrenze für t, als auch die Obergrenze für t, 
informativ, d.h. o liegt im Bereich P(z<t,|w)<a<Plz<t,|w), gilt: 


(3.184) Aq=q,, (y|w,z=t,)-q,, (y|w,z=t)) . 


Wenn dagegen für ein gegebenes o nur die Untergrenze für t, (a) oder nur die 
Obergrenze für t, (b) informativ ist, d.h. entweder der Bereich a > P(z < t,|w) 
und a > P(z<t,|w) oder der Bereich o < P(z<t,|w) und a<P(z<t,|w) vor- 
liegt, gilt: 

(3.185a) Aq=K,—q,,(ylw.z=t) , 

(3.185b) Aq=q, (y|wW,z=t,)—Ko . 


Der Aq -Treatmenteffekt ist daher auch hier in jedem Fall maximal K, — Ko. 


Für die qA-Quantil-Treatmenteffekte gilt für ein gegebenes a gleichermaßen, 
dass K, — Ky eine Obergrenze darstellt: 


(3.186)  qulyolt2)-yılt Is qa ly(t2)- y(t: Is qalyılt)-yolt)I<Kı - Ko 
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3.2.5 Restriktion der Responsefunktion und der Verteilungsfunktion 


Im letzten Abschnitt wurde bei der Darstellung der Unterschiede zwischen den 
Annahmen von MTR und MTS bereits festgestellt, dass die beiden Annahmen 
verschiedene Aspekte der Responsefunktionen betreffen und vermutet, dass sie 
sich sehr gut ergänzen könnten. Insbesondere könnte die Kombination der An- 
nahmen dazu führen, dass Grenzen für die Parameter und Treatmenteffekte er- 
halten, die nicht mehr zum Teil von den Grenzen K, und K,, d.h. von der je- 


weils getroffenen Annahme abhängen. Die Grundlage der Kombination der An- 
nahmen von MTR und MTS bilden die folgenden beiden Abschnitte, in denen 
die IV-Annahme und die MIV-Annahme mit der Annahme von MTR verknüpft 
werden. In Abschnitt 3.2.5.3 wird dann wieder monotone Treatmentselektion 
angenommen, d.h. die Treatmentvariable selbst stellt die Instrumentalvariable 
dar. Dadurch erhält man dann die Annahme von MTS-MTR. In den abschlie- 
Benden beiden Abschnitten werden dann die Annahmen von SMTR und CMTR 
mit der Annahme von MIV kombiniert. 


3.2.5.1 Instrumentalvariablen und Monotone Responsefunktionen 
(IV-MTR) 


Die Analysen aus Kapitel 3.2.3.1 zu der Annahme von MTR können direkt auf 
die Bestimmung der Grenzen für den bedingten Erwartungswert übertragen 
werden. Bei der Bestimmung der Grenzen für diesen Erwartungswert werden — 
zunächst wieder ohne die Ausschlussrestriktion zu verwenden — die Worst-Case- 
Grenzen in (3.135) durch die Grenzen bei Annahme von MTR” ersetzt: 


K, -P(z> tlv =u)+ Elyv=u,z<t)-Plz<tlv=u) 
(3.187) < E sich =u] ? 
<K, Plz < tv = u)+ GK =u,z2 t)- P(z > tv = u) 


Aus (3.187) ermittelt man die Grenzen fiir den unbedingten Erwartungswert: 


> P(v=u)-[K, -P(z> tlv =u)+ E(yv =u,z 2 t): P(z < tly = u)] 
(3.188) < Ely(t)] | 
< YP(v=u)-[K, -Plz<tiv=u A E(ylv = u,z > t): P(z > tlv = vull 


ueV 


°° Vgl. Manski/Pepper (2000), S. 1002. 
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Mit dem Satz von der totalen Wahrscheinlichkeit folgt jedoch wie im Fall der 
Worst-Case-Grenzen, dass diese Grenzen den MTR-Grenzen aus Kapitel 3.2.3.1 


entsprechen: 


3 P(v =u): [K, P(z > tiv = u)+ Elyiv =u,22 d P(z Suz u)| 


Sos = [K, -P(z>t)+ E(ylz < t)- K ( d 
< y(t 
2 Plv =u)-[K, -P(z<tlv=u)+ Elylv = u,z 2 t): P(z 2 tv =u )] 


= DN PS < t)+ E(ylz >t)-P(z2 d 


Durch die IV-Annahme können diese Grenzen nun jedoch wieder verbessert 
werden, indem in (3.179) die MTR-Grenzen für ein gegebenes u durch die ent- 
sprechende größte Unter- bzw. kleinste Obergrenze ersetzt werden: 

sup[K, -P(z > tlv = u)+ E(yv=u,z<t)-Plz<tv=u)] 


(3.190) < Ely(t}v = u] . 
< el? -P(z < tlv = u)+ Bis = u,z >t): pls 2 tv = ull 


Setzt man die Grenzen aus (3.190) wieder in die Berechnung des unbedingten 
Erwartungswertes als iterierten Erwartungswert (3.136) ein, erhält man die 
Grenzen für den unbedingten Erwartungswert E[y(t)] in (3.191) bzw. (3.192): 


=u)-2su ee 
Pl SR a? Elyv=u,z<t)-P(z<tlv= N 


3.191) < E[y(t)] 


< Y P(v =u). dk -P(z<tlv=u 


) 
ueV tey $ E(ylv =u,Z2 t)- P(z = tiv = u) 


sul D P(z >t SE A 


w,v=u 
ueV + E(ylw,v=u,z<t ‚Plz<t 
(3.192) < Ely(t\w] 
r K -P(z < tw,v=u 
N ga 


w,v=u) 
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Als nachstes wird untersucht, welche Grenzen sich fiir die Quantile der Respon- 
sefunktion bei der Annahme von MTR unter Verwendung einer weiteren Kova- 
riaten ergeben. Ohne die IV-Annahme zu treffen, erhält man für das bedingte a- 
Quantil EE OG CH v= ul die folgenden Grenzen: 


(3.193) o, (ylw,v=u)<q,ly(t}w, v =ul< qa, (ylw,v=u) . 


Die Quantile q}, (ylw, v= u) und q,, (y w,v= u) werden entsprechend Ab- 
schnitt 3.2.3.1 in den Bereichen” (3.193) bestimmt mit: 


0 <a<P(z>tlw,v=u)=> Ko < qa <q, 
(3.194) Plz>t\w,v=u)<a<Plz>tw,v=u)>q, < qa S dh, 
P(z > tw,v=u)<a< l > da, Sa S Ky 
(3.195) „a Pe> dwy =u) _ a-i- PE < twv =w] 
P(z < t|w, v =u) P(z < tw,v =u) 
(3.196) As S , 
P(z 2 tlw, v =u) 


Für das unbedingte o -Quantil qa Jutta können wieder die Grenzen aus Kapi- 


tel 3.2.2 übernommen werden, da keine wechselseitigen Restriktionen von den 
Grenzen für die verschiedenen Werte der Kovariaten V ausgehen. 


Wie beim Erwartungswert werden die Grenzen für die bedingten (3.197) und 
damit auch für die unbedingten Quantile (3.198) durch die Ausschlussrestriktion 
entsprechend verbessert: 


(3.197) SUP da, (ylw,v=u)<q,[y(t}w,v =u]< inf qa, (ylw,v=u) , 
ue 


97 i . : : a 
Auf die Kovariate V bedingte Quantile daly(tlw.v =u], dÉ (yw.z=tv=u) sowie 
d (ylw,z = Las u) werden aus Vereinfachungsgründen wieder kurz als qa, qag und 
qx, geschrieben. 
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(3.198) UP 4, (ylw, v =u)<q,ly(t\w]< inf o. (yw,v=u). 


Im nächsten Abschnitt wird nun untersucht, welche Änderungen sich bei Ver- 
wendung monotoner Instrumentalvariablen ergeben. 


3.2.5.2 Monotone Instrumentalvariablen und Monotone 
Responsefunktionen (MIV-MTR) 


In Analogie zu Abschnitt 3.2.5.1 können die Grenzen für den bedingten und un- 
bedingten Erwartungswert der Responsefunktion bei Kombination der Annahme 
von MIV- und MTR ermittelt werden.” Da aus der MIV-Annahme (3.131) di- 
rekt die Ungleichung 


3.19) u <u<u, > Ely(t}w, v = nl Ely(t}w, v = ul < Ely(t}w, v = u, | 


folgte, steigen die Unter- und Obergrenzen fiir die bedingten Erwartungswerte 
Ely(t)w, v= ul theoretisch schwach monoton in u, und die Grenzen sind: 
sup|K, Plz > tlw, v = u,)+ E(ylw,v EE t). P(z < tlw, v = u, )| 


Kë Ely(t}w,v = ul 
w,v= u,)+ E y|w, v =U,,22 t)- P(z 2 tw, v = u, )| 


(3.200) < 
< inf [K, -Plz<t 


u2 2u 


Dies bedeutet, dass der bedingte Erwartungswert Ely(tJw, v = ul nicht kleiner 


sein kann als die MTR-Untergrenze von Ely(t}w,v = nl fiir alle u, <u und 
nicht größer als die MTR-Obergrenze von Ely(t)w, v = u, | für alle u, 2 u. Der 
Erwartungswert Ely(t)}w, v = ul liegt damit wie bei der MIV-Worst-Case-Be- 
trachtung wieder im gemeinsamen Bereich der größten unteren und der kleinsten 
oberen Grenze. Wegen der Monotonie der Instrumentalvariablen werden das 
Supremum und das Infimum jedoch nur aufgrund der Teilbereiche u, <u und 
u, 2 u bestimmt. 


8 Vgl. Manski/Pepper (2000), S. 1002. Auch mit der restriktiveren Annahme linearer 
Responsefunktionen in Verbindung mit MIV kann die Bildungsertragsrate nicht exakt 
identifiziert werden. 
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Die scharfen Grenzen für den unbedingten Erwartungswert ergeben sich dann 
wieder durch Einsetzen der scharfen Unter- und Obergrenzen der bedingten Er- 


wartungswerte in (3.136): 


K -P(z>tlw,v=u 
Se aes I 


nev uj Su 
7 wee -P(z<tlw,v=u 
$ Zei = ulw)- Lil? Elle v =Uy,Z SW P(z> ıw,v= wall 


Für die bedingten Quantile aaly(t}w,v =u] ergeben sich bei Annahme von 
MIV-MTR die entsprechenden Grenzen 


(3.202) supq,, (ylw, v= u)< SEO DA =ul< inf qa, (ylw,v=u) , 


Ui su 


wobei die bedingten Quantile q,, (y WV u) und q,, (y WV =u) wie bei der 
Annahme von IV-MTR, (3.194) - (3.196), bestimmt werden. 


Für das unbedingte a -Quantil SEO CH ergibt sich als Intervall in Analogie 
zu Abschnitt 3.2.4.4 


(3.203) sp sup o, D 


veV| u,<u 


wv=u) | 


WV a) < qa Jutta < inf) inf qa, (y 
veV| u, 2u 


mit dem Unterschied, dass anstelle des Supremums aller Worst-Case-Grenzen 
das Supremum aller MTR-Grenzen verwendet wird. Auf dieses Konstruktions- 
prinzip wird im nächsten Abschnitt noch näher eingegangen. 


3.2.5.3 Monotone Treatmentselektion und Monotone Responsefunktionen 
(MTS-MTR) 


In diesem Abschnitt wird gezeigt, dass bei Kombination der bereits vorgestellten 
Annahmen monotoner Treatmentselektion und monotoner Responsefunktionen 
die Grenzen für den Erwartungswert und den durchschnittlichen Treatmenteffekt 
erstmals nur noch von beobachtbaren Größen und nicht mehr teilweise von K, 
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und K, abhängen. Bei den bislang vorgestellten Annahmen wurden sowohl die 


Unter- als auch die Obergrenze fiir die D-Parameter nie allein durch die empiri- 
sche Evidenz bestimmt, sondern hingen immer auch von K, für die Unter- und 


K, für die Obergrenze ab. 


Die Bestimmung der Grenzen bei Kombination der Annahmen von MTS und 
MTR lässt sich aus zweifachem Blickwinkel interpretieren. Erstens werden im 
Vergleich zu Abschnitt 3.2.4.5 anstelle der Worst-Case-Grenzen MTR-Grenzen 
verwendet und zweitens im Unterschied zu Abschnitt 3.2.5.2 die Bildungsvari- 
able als Instrument für sich selbst anstelle einer von ihr verschiedenen Variable. 


3.2.5.3.1 Scharfe Grenzen für D-Parameter 


Inwieweit das Verwenden der Annahme von MTR die Grenzen verbessern kann, 
die auf der Annahme von MTS basieren, soll zunächst am Beispiel des Erwar- 
tungswertes der Responsefunktion erläutert werden. Bei Annahme von MTS gilt 
nach Abschnitt 3.2.4.5 für die Grenzen der bedingten Erwartungswerte 
Ely(t)w,z = u] und der unbedingten Erwartungswerte E|y(tJw]: 


u<t> K, < Ely(t}w, z= u] < E( = ) 
(3.162) u=t> Ely(t}w,z = u]= E(yiw,z=t) 
u>t> Elylw,z=t)< Ely(t}w,z =u < K 


(3.163) al 


IA IA 


Die Untergrenze (Obergrenze) der Durchschnittslöhne hängt deshalb auch von 
Ko (Kı) ab, da bei der Annahme von MTS nur die realisierten Werte der Perso- 


nen verwendet werden können, für die z,>t (z $ t) gilt. Für alle anderen 
Personen mit realisiertem Treatment z; < t (z j> t) muss die empirische Evidenz 
wegen der Annahme von MTS durch das Supremum K, (Infimum K, ) ersetzt 


werden. Genau hier kann die Annahme von MTR eingesetzt werden. Nimmt 
man MTS und zusätzlich MTR an, kann für die Personen mit z; <t in (3.162) 


das Supremum K, durch den realisierten Lohn y; ersetzt werden, da vorausge- 
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setzt wird, dass bei höherem Bildungsniveau t der Lohn mindestens gleich dem 
Wert yj bei den niedrigeren, realisierten Bildungsniveau z; ist. Daraus folgt für 


(3.163), dass K, durch den bedingten Erwartungswert E(ylw,z = u) zu ersetzen 


ist. Entsprechend kann bei der Bestimmung der Obergrenze für die Personen, 
die ein höheres Bildungsniveau, z Pt realisiert haben, das Infimum K, durch 


den realisierten Lohn y j ersetzt werden, da vorausgesetzt wird, dass bei 


niedrigerem Bildungsniveau t der Lohn dieser Personen nicht größer als der 
realisierte Lohn y; sein kann. Daraus folgt für (3.163), dass K, durch den 


bedingten Erwartungswert E(y 


Kombination von MTS und MTR ergeben sich dann folgende Grenzen für den 
Erwartungswert der bedingten Responsefunktion, Ely(t\w,z = u], indem in 


W,Z= u) ersetzt werden kann. Aufgrund dieser 


(3.200) v=z, d.h. die Instrumentalvariable der Treatmentvariablen gleich 
gesetzt wird: 


sup|K, -P(z > tz = u, )+ Els E d P(z < tz =u, )| 


usu 

Ely(t)z = ul b 
inf DN -P(z< tas u, )+ GE =u,,z>t)-P(z> tz = u, )| 
u2 2u 


(3.200') 


IA IA 


und mit z =u, bzw. z = u, umgeschrieben: 


sup|K, P(u, > tz = nl E(ylu, < t)- P(u, < t)| 


u E[y(t}z = u] 


(3.200") ; 
inf [K, -P(u, Ste u, )+ E(ylu, 2 d P(u, > t)] 
UEEA 


IA IA 


Da beim Supremum P(u, Stee u,)= 0 und beim Infimum P(u, < t|z = u,)= 0 
gilt, kann folgende Fallunterscheidung fiir die bedingten Erwartungswerte 
getroffen werden: 


u < t = sup GK = u,)< Ely(t)z = ul< inf Els = u,) 
u <u u22 
(3.204): u = t = sup Ell = u,)< Ely(t)z -= u] < inf GE = u,) 
uy <t u22 
u > t = sup E(ylz =U, ) < Ely(t}z = ul < inf Elylz = u,) 
u,2u 


u, St 
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Weiterhin gilt aufgrund der Annahmen von MTS und MTR: 


usu> Elylz = u’) = Ely(u')z = u'] 
(3.205) < Ely(ujz=u'] 
Sick al Ebe =u) 


Kombiniert man nun (3.204) und (3.205) erhält man: 


u <t> Ell, zs ul Ely(t}w,z =u] = E(ylw,z =t) 
(3.206) u=t> Ely(t}w,z = ul = E(y W,Z= t) 
u>t> Elylw,z=t)< Ely(t}w,z = u] < E(y|w,z =u) 


Da K, und K, durch empirische Evidenz ersetzt wurden, hängen die Grenzen 
der bedingten Erwartungswerte nur noch von der Verwendung der empirischen 


Evidenz aufgrund MTS-MTR ab. Die Unter- und Obergrenze für die unbeding- 
ten Erwartungswerte der Responsefunktion Ely(t)w] ergeben sich dann wieder 
als gewogenes arithmetisches Mittel und hängen ebenfalls nicht mehr von K, 
und K, ab: 

W,Z= u): P(z = ulw)+ E(ylw,z = d P(z 2 tlw) 


3 Els 
(3.207) < Ely(t}w] 
< > E(ylw,z =u): P(z = ulw)+ E(y|w,z = t): P(z < tlw) 


u>t 


Es gehen also nicht alle beobachtbaren, bedingten und realisierten Erwartungs- 
werte E(ylw,z — u) in die Berechnung der Grenzen ein. Bei der Untergrenze 
(Obergrenze) werden alle Erwartungswerte mit u<t (u2t) verwendet, wäh- 
rend diejenigen fiir u>t (u<t) nicht verwendet, sondern durch E(y W,Z= t) 


ersetzt werden. Die Untergrenze (Obergrenze) kann damit geschatzt werden als 
gewogenes arithmetisches Mittel aller realisierten bedingten Erwartungswerte 
E(y|w,z=u) für alle u<t (u > t), gewichtet mit dem jeweiligen Anteil 
P(z = ulw) , und der realisierten bedingten Erwartungswerte E(y|w,z=t), ge- 


wichtet mit dem Anteil aller Personen mit z j2t (z = t). 


Steffen Wirth - 978-3-631-75476-4 
Downloaded from PubFactory at 01/11/2019 04:32:44AM 
via free access 


134 


Schreibt man den unbedingten Erwartungswert als 


(3.208) Ely(t}w]= D,E(ylw,z = u). P(z = ulw)+ © Elylw,z =u): P(z > uw) , 


u<t u2t 


wird ersichtlich, dass es wegen der Nichtberiicksichtigung der realisierten Er- 
wartungswerte fiir u>t (u<t) bei der Annahme von MTS-MTR keine Punkt- 
schatzung für den unbedingten Erwatungswert gibt. Würden diese mitverwen- 
det, ergäbe sich die Schätzung des unbedingten Erwartungswertes durch die 
Verwendung des Stichprobenmittelwertes gemäß der Annahme von ETS. Als 
erste Konsequenz der Annahme von MTS-MTR kann festgehalten werden, dass 
die Grenzen des unbedingten Erwartungswertes in (3.205) weder von K, noch 


von K, abhängen und die Grenzen unabhängig davon bestimmt werden können, 


ob die Ergebnisvariable y beschränkt ist oder nicht. Auch bei der Verwendung 
der Annahme von MTS-MTR ergeben sich Spezialfälle, falls die Grenzen für 
das kleinste bzw. das größte Treatment untersucht werden. 


Für das kleinste Treatment tmin ergibt sich wegen P(z < tin|W)= 0 und 
P(z> t minw) = 1, dass die Untergrenze von E[y(t min w] nur noch von der 
empirischen Evidenz abhängt: 


(3.209) 3" E(y|w,z = u). 0+ E(ylw,z = tmin): l= E(ylw, Z= train )S Ely (tmin jw] 


U<t min 


Für das größte Treatment t,,, ergibt sich wegen P(z > t max |W) = 0 und 
P(z < t max |W) = 1, dass die Chena von Ely(t tnax Jw] wie bei der Annahme 
von MTS nur noch von der empirischen Evidenz abhängt: 


(3.210)  Efy(tmax)]< Elylz = tmx)= DEbWlz=u)0+Elyz=t ,)1 


u>t max 


Zu Grenzen aufgrund MTS-MTR kommt man auch, wenn man die Grenzen 
nach MTR als Ausgangspunkt verwendet: 


Ko: P(z > del E(ylw,z < t): P(z < tw) 
E y(t)w 
K; Plz < tlw) + E(ylw,z > t): P(z > tw) 


(3.211) < 
< 
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Nimmt man hier fiir die Untergrenze (Obergrenze) an, dass diejenigen, die ein 
realisiertes Treatment z aufweisen, das größer (kleiner) als das betrachtete 
Treatment t ist, nicht K, (K,) als Ergebnis realisieren würden, wenn sie statt 
Treatment z Treatment t realisiert hätten, sondern mindestens (höchstens) so 
viel, E( ze ), wie diejenigen, die z=t realisiert haben, wiirden sich als 
Grenzen ergeben: 


Ell, = t): P(z > tlw) + E( 
(3.212) < E[y(t)}w 
< 2 = U P(z < t|w)+ E( 


W,ZS d P(z < tlw) 


w,z 2 t): P(z 2 tw) 


Dies entspricht aber exakt den Grenzen, die sich aufgrund MTS-MTR ergeben, 
wenn man die Unter- und Obergrenze umschreibt 


E( E t)- P(z > t|w )+ E( < ). P(z < tlw) 
(3.213) =E(ylw,z=t)-P(z> tlw) + E( Lëtz < tlw) 

= E(y EZ t). P(z > t|w) + Zu ): P(z < tlw) 

E(ylw E t)- P(z < tlw) + E(ylw W,Z2 d P(z = tlw) 
(3.214) = E( = t)- P(z < t|w)+ E( ). P(z > tlw) 

= D z = t)-P(z < tlw)+ Zi )- P(z > tlw) 


und das realisierte Treatment t in das gewählte Treatment u umbenennt. 


u< t= Dlylw,z=ul< D[y(t}w,z = a) EE 
u=t> Diy(tJw,z = ul= =t ; 
> =t|< Diy(t}w,z = u 


bzw. 


‚z=t|-P(z> tlw) 


< E(t) 


= t]-P(z < tw) 
u>t 
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3.2.5.3.2 Scharfe Grenzen fiir D-Treatmenteffekte 


Die Obergrenze für den Treatmenteffekt A, ,, ergibt sich als Differenz der 
Obergrenze der Responsefunktion fiir das Treatment t, und der Untergrenze der 
Responsefunktion für das Treatment t,, da es möglich ist, dass der Erwartungs- 
wert Ely(t, Lk = u] an seiner Obergrenze und gleichzeitig der Erwartungswert 
Ely(t, Jz = ul an seiner Untergrenze liegt.” 


Au t, -| Ey |z =u):P(z =u)+E(ylz = t,)- P(z < d 


u>ty 


EE 


(3.215) 
EE <xsts)oPle<t)] 


| Sev lz=0:Pe =+ 862-1} Pl ul t] 


u<t; 


Diese Differenz lässt sich so umschreiben, dass ein direkter Vergleich mit der 
Annahme exogener Treatmentselektion erfolgen kann: 


Dr ës Siss P=) 


u<tj 


(3.216) + [Elyz =t,]- E(ylz =t,)|- P(t, <z<t,) 


+] Siku 2-9) Ey i2=W)Pe=w) 


u>ty 


Zum Vergleich dieser Obergrenze mit dem Treatmenteffekt bei Annahme von 
ETS, wird der ETS-Treatmenteffekt umgeschrieben zu (3.217). Damit ergibt die 
Differenz zwischen dem Treatmenteffekt aufgrund der Annahme von MTS- 
MTR und der Annahme von ETS mit (3.218). 


? Vgl. Manski/Pepper (2000), S. 1005. 
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t max 


E(ylz =t, )- Elylz = dE LIEW = ty )- E(ylz =h )- P(z=u) 
> [Eye u t,)- Elylz =t ). P(t; <z<t,) 
(3.217) EH 
-|+ Ska rbl 


u<tj 


+ KSE = t,)- Elle =t, L P(z = u) 


u>ty 


MTS-MTR E 


Ai Abt DEyw,z=t)- E(y|w,2=u)} P(e = uw) 
(3.218) = 
+ X lelyw.z =u)-E(ylw,z = t, IJ. Pis = ulw) 


Die Obergrenze des Treatmenteffekts A, ,, kann somit bei Gültigkeit der An- 


nahme von MTS-MTR nicht kleiner sein als der ETS-Treatmenteffekt, da in 
(3.218) bei Gültigkeit der Annahme von MTS-MTR der Erwartungswert 
E(y W,Z= t,) größer sein muss als der Erwartungswert E(y W,Z= u) fiir alle 


Realisationen kleiner als t, und der Erwartungswert E(y 


W,Z= u) größer sein 


muss als der Erwartungswert E(y W,Z= t,) für alle Realisationen größer als t,. 


Der Treatmenteffekt bei Annahme exogener Treatmentselektion ist somit eine 
Untergrenze für die Obergrenze des Treatmenteffekts bei Annahme von MTS- 
MTR. 


Die Untergrenze des MTS-MTR-Treatmeteffekts ergibt sich, berechnet als Dif- 
ferenz der Untergrenze bei t, und der Obergrenze bei t, als 


A, = | Ey |w,z = u): P(z = ulw) + E(y 


u<ty 


vazu) Pezu) 
(3.219) 


286 |w,z=u)-P(z=ulw)+ Ely 


u>tj 


ee) 
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An, = | DIEy 


u<tj 


w,z=u)-E(y|w,z=t,)|- P(z = uw) 
(3.220) 


d S [Ey |w,z= t,)- Ely 


W,Z= ol, P(z = eil 

u>t2 

Bei Gültigkeit der Annahme von MTS-MTR müssen in (3.220) jedoch beide 
Summanden notwendigerweise negativ sein, so dass die Untergrenze des 
Treatmenteffekts bei MTS-MTR immer negativ wäre. Wenn man jedoch die 
Implikation der Annahme von MTR aus Abschnitt 3.2.2 berücksichtigt, ergibt 
sich wie eingangs schon angedeutet die Untergrenze von 0 für den Treatmentef- 
fekt bei Annahme von MTS-MTR.'” 


3.2.5.3.3 Ein Test für die Annahme von MTS-MTR 


Bei der Herleitung der Grenzen für den unbedingten Erwartungswert aufgrund 
der Annahme von MTS-MTR wurde folgende Implikation verwendet 


(EE E(ylz = u')= Ely(u')z = u'] 
(3.205) < Ely(u)z = vi 
< Ely(uje=u]= Ebe =v) 


Daraus ergibt sich direkt, dass die Annahme von MTS-MTR abgelehnt werden 
kann, wenn Elylz = u) nicht schwach monoton in u steigt. Auch hierfür gibt es 


bereits eine Vielzahl von Tests, die größtenteils auf der Arbeit von McFadden 
(1989) beruhen, da dieser Test eine abgeschwächte Version des Tests der 
Hypothese aus Abschnitt 3.2.3.4 darstellt, dass die Responsefunktion monoton 
verläuft und die Realisation der Treatmentvariablen z stochastisch unabhängig 
von der Responsefunktion y(-) ist.'”' Deshalb wird an dieser Stelle nicht näher 
auf die Konstruktion dieser Tests eingegangen. 


a Vgl. Manski/Pepper (2000), S. 1005. 
TI Vgl. Manski/Pepper (2000), S. 1004. 
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3.2.5.4 Zur Bestimmung scharfer Grenzen für Quantile über scharfe 
Grenzen für die Verteilungsfunktion 


Im Folgenden sollen die in den vorangegangenen Abschnitten aufgezeigten 
Grenzen für die unbedingten Quantile im Worst-Case-Fall und bei den Annah- 
men von MTR, MTS sowie MTS bei strikter stochastischer Dominanz über das 
Gesetz iterierter Erwartungen in der Form 


Ply(t)<r]= Zplytt)< rz = uP = u) 


u<t 


(3.221) + P(y <ız= t)P(z = t) 


+ > Ply(t)< rlz = uP(z =u) 


u>t 


hergeleitet werden. Zunächst wird der Worst-Case-Fall aus Abschnitt 3.2.2 be- 
trachtet. 


3.2.5.4.1 Worst-Case-Grenzen 


Trifft man keine Annahmen über die gewählten Treatments 


(3.222) u <u > oa, W,Z= u, | 


west 


ergeben sich fiir die bedingten Quantile qaly(t)z = ul unmittelbar die folgen- 
den Grenzen: 


u<t> Ko <q,ly(t\z =u]< Lë 


(3.223) u=t>q, [y(t)z = u] = Ga (ylz = t) 
u>t> Ko <q,ly(t}z =ul< K, 


Für die unbedingten Quantile q.ly(t)| ergibt sich mit (3.221) und (3.222) und 
r* = qa (ylz = t), dass für jedes r<r* und r>r*, 
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u<t>  0<Ply(t)<rz=uls 
(3.224) u=t= Ply(t)<rz=ul=Ply <rz=t) 
u>t> O<Ply(t)<rz=uj<! 


gilt. Damit erhält man für r<r* und r>r* die Grenzen für P[y(t)< r] als: 
(3.225) P(y < rlz = t)P(z =t)<Ply(t)<r]< Ply < r|z = t)P(z = t)+P(z#t) 


Durch Invertieren dieser Grenzen für die Verteilungsfunktion erhält man die 
Grenzen für das unbedingte qa [y(t)]-Quantil: 


Für r<r* gilt 

(i) P(y E t)P(z =t)+P(z¥t)<a => Ply(t)<r]<a 

(ii) P(y<riz=t)P(z=t)>a = Ply(t)<r]za 

Allerdings ist (11) wegen P(y < r|z = t) <q nicht möglich. Deshalb ist nur (i) 
wirksam. Aus (1) folgt 


a-Plz#t) 


P(z=t) 


Diese Ungleichung ist informativ, falls die Bedingung a—P(z # t)> 0 erfüllt 
ist. Dann ergibt sich das 


(3.226) P(y <ız= t)< => Ply(t)<rl<a . 


(3.227) adyol P =t) Quantil 


(z=) 
von P(ylz = t) als Untergrenze. 


Für r2>r* gilt 
(i) P(y < r|z = t)P(z =t)+P(z#t)<a =>Ply(t)<rl<a 
(11) P(y < r|z = t)P(z =t)>a >Plylt)<r]> « 


Allerdings ist (i) wegen P(y < r|z = t)> a nicht möglich. Deshalb ist nur (ii) 
wirksam. Aus (11) folgt 
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(3.228) Ply<ılz=t)> > Ply(t)<r]>a . 


SE t) 


Diese Ungleichung ist informativ, falls die Bedingung a<P(z=t) erfüllt ist. 
Dann ergibt sich das 


8.229) qils; ES 5 -Quantil 


von P(y|z = t) als Obergrenze. 


Damit erhält man die in Abschnitt 3.2.2 bereits besprochenen Fallunterschei- 
dungen: 


0 <as<P(z#t)> Ko < qaly(t 
Plz=t)<a< 1 > qy] < K, 
P(z + t) <a< 1 > ag (ylz = t) < SEO) 


(3.230) 0 <as<P(z=t)> aaly(t)] za, (yz =t) 


P(z=t)<a<P(z4t)> K, <aq,ly(t)i<s K, 
Plz#1)<a<Plz=1)>q,,(yz=t)< aaly(t)] <q, bb =t) 


3.2.5.4.2 Monotone Responsefunktionen 


Aus der Annahme von monotoner Responsefunktionen 
(3.51) t, St, >y,(t)) <y;(t,) 
folgten die Grenzen für die individuelle Responsefunktion 


2,<t>y,sy()sK, 
(3.52) z,=t> y,(th=y; 
z,>t>K,sy,(t)sy, 
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Daraus folgt für das unbedingte Quantil q,[y(t)] mit dem Gesetz iterierter Er- 
wartungen in der Form (3.221) aus dem vorhergehenden Abschnitt: 


Mit r* = qa(ylz = t) gilt für r<r* und für r>r* 


u<t>0<Ply(t)<rz=ul<P(y<riz=u) 
(3.231) u=t> Ply(t)< r|z =ul= P(y<riz =t) 
u>t> P(y<riz=u)< Ply(t)< riz =ul<1 


Also gilt für die beiden Fälle, r<r* und r2>r*, 
(3.232)  P(y < rlz > t)P(z > t)< P[y(t)< r]< Ply < rlz < t)P(z < t)+ P(z > t) 


Durch Invertieren dieser Grenzen für die Verteilungsfunktion erhält man die 
Grenzen für das unbedingte q, [y(t)]-Quantil: 


(i) Ply < rlz < t)P(z <t)+P(z>t)<a => Ply(t)<rl<a 
(ii) Plys rlz > tP(z>2t)2a => Ply(t)<r]>a 


Aus (1) folgt 


a-P(z>t) 


(3.233) Ply<rlz<t)< Pe <t) 


=> Ply(t)<r]<o . 


Diese Ungleichung ist informativ, falls die Bedingung a-P(z>t)>0 erfüllt 
ist. Dann ergibt sich das 


a-P(z>t) 


0239) all Tee 


-Quantil 


von P(ylz < t) als Untergrenze. 


Aus (ii) folgt 


(3.235) Ply<rz2t)>» — — = Ply(t)<r]<a . 
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Diese Ungleichung ist informativ, falls die Bedingung a < P(z 2 t) erfüllt ist. 
Dann ergibt sich das 


(3.236) q,ly(t)]< -Quantil 


Pes >t) 
von P(yiz _ t) als Obergrenze. 


Damit erhält man wieder die in Abschnitt 3.2.3.1 ermittelten Bereiche 


0 <asP(z>t)h> K,  saaly(t)lsa,(ylz2t) 
(3.237) P(z>t)<asP(z2t)>q, (ylz<st)<q,[lytt)l< q, (z=) 
P(z>t)<a< 1 = 4, (ylz<t)<qaly(t)]< K, 


a- P(z > tw) o 


i P(z < dw) i P(z 2 tw) 


3.2.5.4.3 Monotone Treatmentselektion 


Mit der Definition der Quantil-Monotonie in (3.131) 


ly 


(3.131) u <u >a4,ly 


und dem in (3.221) formulierten Gesetz iterierter Erwartungen können die Gren- 
zen für das unbedingte Quantil q,[y(t)] abgeleitet werden.. Im Gegensatz zu den 


beiden vorangegangenen Abschnitten ist hier eine Fallunterscheidung nötig, ob r 
größer oder kleiner als das bei t identifizierbare a -Quantil r* = q, (ylz = t) ist. 


Fir r<r*: 
Falls u < t, gilt P(y < rz = t)< P[y(t) < rlz =u] und P(y<riz=t)<a 
Daraus folgen die Grenzen 


(3.238) u<t>0<Ply(t)<rz=uls! 
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Falls u> t, gilt Ply(t)< rz = u]< Ply < riz = t) und P(y<rjz=t)<a. . 
Daraus folgen die Grenzen 
(3.239) u>t>0<Ply(t)<rz=ul<Ply<rz=t)<a . 
Für r2r*: 
Falls u < t, gilt P(y < riz = t)< P[y(t)< rẹz = u] und a < Ply < rlz =t). 
Daraus folgen die Grenzen 
(3.240) u<t=>a x< Ply < rlz =t)< Ply(t)< rlz =u]<1 . 
Falls u >t, gilt Ply(t)< rlz = u]< P(y < r|z = t) und a < Ply < rz =t). 
Daraus folgen die Grenzen 
(3.241) u>t>0<Ply(t)<rz=ul<1 . 
Mit diesen Grenzen erhält man die Grenzen für die Verteilungsfunktion 
Für r<r*: 


P(y < rlz = t)P(z =t) 
(3.242) <Plylt)<r] 
<P(z<t)+Ply<rz=t)P(z=t)+aP(z>t) 


Für r>r*: 


aP(z<t)+Ply<rz=t)P(z=t) 
(3.243) <Ply(t)<r] 
<P(z#t)+Ply<rz=t)P(z=t) 


Durch Invertieren dieser Grenzen für die Verteilungsfunktion erhält man wieder 
Grenzen für das unbedingte o. |y(t)]-Quantil. 
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Für r<r*: 
(i) P(z < t)+ P(y < r|z = t)P(z =t)<a > Ply(t)<rl<a 
(ii) P(y<r2=t)P(z=t)2« > Ply(t)<r]> « 


Allerdings ist (ii) wegen P(y< riz = t)< a nicht möglich. Deshalb ist nur (i) 
wirksam. Aus (i) folgt 


(3.244) Ply<rz=t)<a-(1-a)P(z<t)/P(z=t) > P[y(t)<r]<a . 


Dies lasst sich schreiben als 


goe Poar A e Sohlen, 
P(z =t) 
. l E ; i ' P(z <t) BE 
Diese Ungleichung ist informativ, falls die Bedingung a > P<t) erfüllt ist. 
Z< 


Dann ergibt sich das 


(3.246) q.[y(t)]= aP(z st) Da zU oO anti 
` P(z=t) 


von P(ylz = t) als Untergrenze. 


Für r >r*: 
(i) P(z#t)+Ply<ılz=t)P(z=t)<a => Ply(t)<r]<a 
(ii) aP(z < t)+ P(y SIb: t)P(z =t)>a >Plytt)sr]>« 


Allerdings ist (i) wegen Ply < r|z = t)> a nicht möglich. Deshalb ist nur (ii) 
wirksam. Aus (ii) folgt 


aP(z >t) 


P(z =t) 


(3.247) Ply<riz=t)> > Ply(t)<r]2«. 
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Diese Ungleichung ist informativ, falls die Bedingung o Er ; erfüllt ist. 


Dann ergibt sich das 


(3.248) abols oP(z 2 t SH, -Quantil 


P(z= 


von Pla = t) als Obergrenze. 


Damit erhält man die folgenden informativen und nichtinformativen Bereiche 
für das unbedingte q,[y(t)]-Quantil: 


0 <as i < Ky <a a, z=") 
(3.249) ne = 1 a< Posy? a, (viz=t)saaly(t)]< a, (yz =t) 
Passes | >m bessai] K; 
(3.250) %, Se und 2, SH, 


Unter- und Obergrenze für das unbedingte Quantil sind immer simultan infor- 
mativ, falls das kleinste Treatment (t „in ) oder das größte Treatment (tnax ) be- 


trachtet werden. 


min 


0<a<P(z=t) 
P(z<t)<a<l 


min * 


et ot 


max : 
3.2.5.4.4 Monotone Treatmentselektion bei strikter stochastischer 
Dominanz 


Mit der Definition strikter Quantil-Monotonie für die bedingten Quantile: 
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> P(y < de = t) 


u<t= Ply(t)<rz=u 
<P(y<riz=t) ` 


u >t > Ply(t)<rz=u 


folgt für alle r: 


Daraus folgt für die bedingten Quantile q,ly(t]z=u] entsprechend dem Fall 
bei Quantil-Monotonie aus dem letzten Abschnitt: 


u<t> Ko < qaly(t)w, 2= u] <q,( =t) 
u=t> qaly(t)w,z = ul=q.\ylw,z=t 
u>t=>q,(ylw,z=t)< qaly(t}w.z =u < K, 


Für das unbedingte q.|y(t)]-Quantil folgt dann für r<r* und für r>r*: 


u<t> P(y<rz=t)<P y(t) < rz =u|<1 
(3.252) u=t> Plyt) <ız=ul= P(y <Iz= t) 

u>t>0s Ply(t)< r|z = ul< P(y <ılz= t) 
Damit gilt fürr<r* und fiir r2r*: 
(3.253) Ply<srz=t)P(z<t)<Ply(t)<r]< Ply<rz=t)P(z>t)+P(z<t) 
Mit diesen Grenzen erhält man die Grenzen für die Verteilungsfunktion: 


Für r<r*: 


(i) P(y < r|z = t)P(z >t)+P(z<t)<a >Plylt)<r]<a 
(ii) P(y < rlz = t)P(z <t)za >Ply(t)<rlza 


Allerdings ist (11) wegen Ply < rb = t)< a nicht möglich. Deshalb ist nur (i) 
wirksam. Aus (i) folgt 


a-P(z<t) 


P(z >t) 


Diese Ungleichung ist informativ, falls o > P(z < t)/P(z < t) erfüllt ist. 


(3.254) Ply<ılz=t)< > Ply(t)<r]<a . 
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Dann ergibt sich das als Untergrenze von P(ylz = t) das 


(3.255) abe PE -Quantil. 
El 


Für r>r*: 


(i)  Plysrz=t)P(z>t)+P(z<t)<a =>Ply(t)<r]<a 
(ii) Ply<rz=t)P(z<t)2a >Plylt)<r]> «a 


Allerdings ist (i) wegen P(y < r|z = t)> a nicht möglich, da für e> 0 gilt: 


(a+e)P(z>t)+P(z<t)<a 
& eP(z>t)+ P(z<t)<aP(z<t) . 
e eP(z >t)+(1-a)P(z<t)<0 


Aus (ii) folgen die Grenzen 


(3.256) Ply<rlz=t)> 


> Ply(t)< r] =O 


TER t) 


Diese Ungleichung ist informativ, falls die Bedingung a<P(z<t) erfüllt ist. 
Dann ergibt sich als Obergrenze für P(ylz = t) das 


3.257) q,[y(t)]< SC -Quantil. 


Damit erhält man die informativen und nichtinformativen Bereiche in (3.258): 


0 <asPpe<t)> K, sqlyWlsq, (ylz=t) 
3.258) Pla<t)<a<Pla<t)>q,(ylz=0)<q,lyt)lsa, (ylz=t) ‚mit 
Past)<a< 1 adr Dsg: K; 


a—P(z<t) 


P(z >t) 


(3.259) A, = und A, = 


T t) 
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3.2.6 Identifikation von Bildungsertragsraten unter Verwendung des 
Roy-Modells 


Als letzter Ansatz zur nichtparametrischen Schätzung von Bildungsertragsraten 
wird auf ein Modell zuriickgegriffen, das von Willis/Rosen (1979) entwickelt 
wurde und wie ein großer Teil der zuletzt behandelten Ansätze das Selektions- 
problem berücksichtigt. Willis/Rosen konstruierten auf der Basis eines von Roy 
(1951) entwickelten Modells!” zur Erklärung der Beschäftigungswahl und sei- 
ner Konsequenzen für die Einkommensverteilung ein strukturelles Modell zur 
Erklärung der Wahl der Universitätsausbildung. Im Unterschied zu Roy (1951) 
und Heckman/Honoré (1990) untersuchen Willis/Rosen die Auswirkungen der 
Selektion auf die Einkommensverteilung. Es müssen deshalb im Folgenden 
keine Annahmen über die Verteilung der Fähigkeiten und der Löhne getroffen 
werden. Das Modell ist aber nicht auf die Erklärung der Entscheidung für oder 
gegen eine Universitätsausbildung beschränkt, vielmehr lassen sich damit die 
Entscheidungen für oder gegen jedes Ausbildungsniveau untersuchen. Im Roy- 
Modell”, wie es von Willis/Rosen spezifiziert wurde, wird angenommen, dass 
Einkommenserwartungen, Fähigkeitsunterschiede sowie unterschiedliche Fami- 
lienstrukturen der Individuen eine entscheidende Rolle bei der Wahl der Univer- 
sitatsausbildung spielen. 


Es werden zwei Ausbildungsniveaus, t, und t,, betrachtet, wobei t, z. B. einen 
Abschluss geringer als Universitätsdiplom und t, einen Universitätsabschluss 
bezeichnet. 


Wählt Individuum j den Abschluss t,, erwartet es den Einkommensstrom y,, in 


(3.243), wobei t den Zeitindex darstellt und a die Zeit, die das Individuum ge- 
genüber dem Abschluss t, zusätzlich in Bildung investiert. 


y,,(t)=0 0<tsa 


3.260 
l ) yi;(t)=0= ye" a<t<o 


192 Auf der Grundlage des ursprünglichen Roy-Modells wurden etliche andere 
Selektionsprobleme untersucht, beispielsweise die Entscheidung von Frauen, ihre Arbeit 
auf dem Arbeitsmarkt anzubieten (Gronau (1974), Heckman (1974)) oder die Wahl, in 
einem Gewerkschafts- oder Nichtgewerkschaftssektor zu arbeiten (Lee (1978)). Weitere 
Arbeiten sind in Heckman/Honoré (1990) aufgeführt. 

10% Heckman/Honoré (1990) bezeichnen dieses von Willis/Rosen (1979) entwickelte Modell 
als "hierarchical model of the labor market". 
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Damit erwartet ein Individuum, das den Abschluss t, wählt, den Einkommens- 
strom 


(3.261) Folth=yae” Dei; 


Im folgenden wird auf den Index j verzichtet und angenommen, dass der Abzin- 
sungsfaktor r und die Wachstumsrate der Einkommen g konstant und für alle 
Individuen gleich sind, r>g ist und die Individuen einen unendlichen Zeithori- 
zont haben. Es werden weder direkte Schulkosten noch nichtgeldliche Aspekte 
der Selektionsentscheidung berücksichtigt. Dann ergibt sich der Barwert des 
Einkommensstroms V, bei Wahl von t, und V, bei Wahl von t, als 


V= [ye “at = Alen 
(3.262) a J 


Ka 


Vo = fyoe “dt = 0 
0 degt 


Demnach entscheidet sich ein Individuum für den Universitätsabschluss, wenn 
der Barwert der Einkommen bei der Wahl von t, mindestens so groß ist wie bei 


der Wahl von t,, V, 2 V). Dies ist gleichbedeutend mit 


(3.263) V, 2 V) © = > . ye 2zV¥p @yı2Yoe" . 


Aus diesen abdiskontierten Einkommensströmen folgt, dass für ein Individuum, 
das sich für den Abschluss t, entscheidet 


(3.264) E(V,|w,z=t,)> E(V,|w,z =t, les Ee" W,Z= t,)2 E(y,|w,z =t,) 
gilt und für ein Individuum, das sich für den Abschluss t, entscheidet, 
(3.265) E(V,|w,z=t,)> E(V,|w,z =t) E(y,e" W,Z= to)2 E(y,|w,z = ty) 


gegeben ist. Dies erlaubt es nun, die Grenzen fiir E(y,|w) und E(y,|w) und da- 
mit auch fiir den Treatmenteffekt zu verbessern. 
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3.2.6.1 Scharfe Grenzen fiir den Erwartungswert 
Im Rahmen des Roy-Modells beschränkt sich die Betrachtung auf die Bestim- 
mung von Grenzen für den unbedingten Erwartungswert und im nächsten Ab- 


schnitt auf Grenzen für den durchschnittlichen Treatmenteffekt. 


Mit E(y,|w) = Ey, W,Z= t, JP(z = t,|w) + E(y, W,Z=ty )P(z = talw) und der Un- 
gleichung (3.265) erhält man als Grenzen für den Erwartungswert E(y,|w) 


E(y,|w,z=t, )P(z=t,|w)+ KyP(z=t,|w) 
(3.266) <E(y,|w) 


< E(y,|w,z=t, Pis Gel Een wz=t, PP(z =t,|w) 


und mit E(y,|w)= E(yolw,z = t, Pz = t,|w)+ Ely, 
der Ungleichung (3.264) die Grenzen fiir E(y,|w) 


w,z=t,)P(z=t,|w) sowie 


K,P(z = t,|w)+ Ely, 
(3.267) <E(y,|w) 
< Een 


w,z=t, )P(z=to|w) 


W,Z= ty JPlz = to|w) 


W,Z= t Pe = t,|w) + Els, 


3.2.6.2 Scharfe Grenzen für den durchschnittlichen Treatmenteffekt 


Aus den Grenzen für die unbedingten Erwartungswerte E(y,|w) und E(y,|w) 
folgen nun wieder die Grenzen des durchschnittlichen Treatmenteffekts in 
(3.268). Die Obergrenze (Untergrenze) erhält man aus der Obergrenze (Unter- 
grenze) von E(y,|w) abzüglich der Untergrenze (Obergrenze) von E(y,|w). Es 
zeigt sich, dass das Vorzeichen des Treatmenteffekts nichtidentifizierbar ist und 
beide Grenzen von Ky, aber nicht von K, abhängen. 


Ely, w,z=t, (SÉ = t,]w) + K,P(z = talw) 

- B(y,e" w,z=t, Pe = t,|w)— Elyolw,z sti biz = to|w) 
(3.268) < E(y,|w)- GE 

< E(y,|w,z=t, )P(z =t,|w)+ E(y,e™|w,z = to P(z =t,|w) 

~ KoP(z = t,|w)— E(yo|w,z = tp )P(z = to|w) 
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3.2.7 Ein systematischer Vergleich zentraler Ansätze 


In diesem Abschnitt sollen die Unterschiede der wichtigsten Annahmen im Hin- 
blick auf Unter- und Obergrenze der Treatmenterwartungswerte und die Ober- 
grenze des Treatmenteffekts systematisch herausgearbeitet werden. Bei dem 
Treatmenteffekt wird lediglich die Obergrenze untersucht, da die Untergrenze 
des Treatmenteffekts bei Annahme von MTR, SMTR, CMTR und MTS-MTR 
nach unten durch Null begrenzt ist, und zudem im empirischen Teil die Ober- 
grenzen der Bildungsertragsraten im Mittelpunkt des Interesses stehen werden. 


Sowohl bei den Grenzen der Treatmenterwartungswerte als auch bei der Ober- 
grenze des Treatmenteffekts werden in den Kapiteln 3.2.7.1 und 3.2.7.3 in ei- 
nem ersten Schritt die Grenzen aufgrund der jeweiligen Annahme allgemein und 
in Spezialsituationen dargestellt und dann in einem zweiten Schritt in den Kapi- 
teln 3.2.7.2 und 3.2.7.4 untersucht, von welchen Größen die Differenzen der 
Obergrenzen bei den verschiedenen Annahmen abhängen. In diesem Abschnitt 
wird zugunsten der Übersichtlichkeit auf eine Nummerierung der Formeln ver- 
zichtet. 


3.2.7.1 Übersicht über die Grenzen für Erwartungswerte 


Die untersuchten Annahmen wirken sich gleichermaßen auf Ober- und Unter- 
grenze der Treatmenterwartungswerte aus und werden daher exemplarisch an- 
hand der Obergrenze der Treatmenterwartungswerte besprochen. Die allgemeine 
Darstellung dieser Grenzen ist den entsprechenden Abschnitten entnommen und 
wird lediglich um Darstellungen ergänzt, die der besseren Interpretation hilf- 
reich sind. Zusätzlich zu der allgemeinen Darstellung wird nun systematischer 
als bisher untersucht, welche Vereinfachungen und Spezialfälle sich bei der Be- 
trachtung der Grenzen am Minimum (t,,,,) und Maximum (tax) der Treat- 


mentvariablen ergeben. 


min 


Bei der Betrachtung der Obergrenzen der Treatmenterwartungswerte in Tabelle 
3.7 fällt sofort auf, dass der Erwartungswert E(ylw), der nur von den vorgege- 
benen Charakteristika w, aber nicht von dem betrachteten Wert t der Treatment- 
variablen abhängt, bei den Annahmen von MTR, CMTR und MTS-MTR die 
Obergrenze des Treatmenterwartungswertes für das Minimum der Treatmentva- 
riablen (t,,,,) darstellt. Der Grund dafür ist, dass bei diesen drei Annahmen die 


Monotonie bezüglich der Responsefunktion (MTR) verwendet wird, durch die 
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für alle Personen deren realisiertes Treatment z größer oder gleich dem betrach- 
teten Treatment t sind, die empirische Evidenz, d.h. der realisierte Wert der Er- 
gebnisvariablen verwendet wird. 


Ähnliches gilt für die Annahmen MTS und MTS-MTR bei der Betrachtung der 
Obergrenze für das Maximum der Treatmentvariablen It... 1. Da aufgrund der 


Annahme monotoner Treatmentselektion für alle Personen, deren realisiertes 
Treatment z kleiner gleich dem betrachteten Treatment t ist, der Treatmenter- 
wartungwert E(ylw,z = t) verwendet wird, ergibt sich für ` Uz tnax 
E(ylw,z = (D als Obergrenze des Treatmenterwartungwertes. Dies wiederum 


entspricht dem Treatmenterwartungswert aufgrund der Annahme exogener 
Treatmentselektion (ETS). 


Anhand der Ermittlung der Obergrenze für t=t,, 
Annahme von MTS-MTR soll dies gezeigt werden: 


und t= tna aufgrund der 


n X 


E(y|w,z > t nin ). P(z > tmin(W)+ E(y|w,z = tmin) P(z < Lol 
e E(y|w,z = tmin)" Plz a Lehr lt Ely WET ein) Plz = Geht 
= Elle) 


W,Z= t nax ). P(z < t max |W) 


E(y|w,z > Las ) P(z = tmax|W)+ Ely 
= E(y|w,2 = trax ) 


Die Grenze im Worst-Case-Fall ergibt sich zweimal. Zum einen bei der Ermitt- 
lung der Obergrenze für t= t nin aufgrund MTS, da aus der Darstellung 


K; Plz > tlw)+ E(ylw,z=t)-P(z=t\w)+ Elylw,z = t): P(z < tiw) 
— a 


K bei Worst-Case 


hervorgeht, dass der Unterschied zwischen der Worst-Case- und MTS-Grenze 
von Ge < de: abhängt, dem Anteil derjenigen, deren realisiertes Treatment z 
kleiner als das Betrachtete t ist. Dieser Anteil ist umso geringer, je weiter man 
sich dem Minimum der Treatmentvariablen t n»n nähert und gleich Null, wenn 
man die Obergrenze des Treatmenterwartungswertes für das kleinste Treatment 
tnin bestimmt. 
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Dasselbe gilt für die Obergrenze bei t= tnax aufgrund MTR mit der Darstellung 
als 


K; -P(z < tlw)+ E(y|w,z = t): P(z = tlw) + E(y|w,z >t) -P(z > tlw). 


K bei Worst-Case 


Der Unterschied zu der Worst-Case-Grenze hängt hier von P(z > tw) ab, dem 


Anteil derjenigen, deren realisiertes Treatment z größer als das Betrachtete t ist. 
Dieser Anteil ist umso geringer, je weiter man sich dem Minimum der Treat- 
mentvariablen tax nähert und gleich Null, wenn man man die Obergrenze des 


Treatmenterwartungswertes für das größte Treatment tnax bestimmt. 


Für die empirische Anwendung hat dies zum einen die Konsequenz, dass sich 
der ETS-Treatmenteffekt und die Obergrenze des MTS-MTR-Treatmenteffekts 
für Lo entsprechen bzw. sich tendenziell umso mehr entsprechen, je näher t; 


an tan und t, an Lo liegt. Zum anderen ist die Obergrenze aufgrund MTS- 
MTR für t= tain und die Untergrenze für t= tnax mit E(y|w) identisch, so dass 
auch auf diesem Wege demonstriert ist, dass die Untergrenze des Treatmentef- 
fekts, die als Untergrenze für tmay minus Obergrenze für tmin berechnet wird, an 
dieser Stelle der scharfen Grenze von Null entspricht. 


Eine einfachere Darstellung der CMTR-Grenzen für die Treatmenterwartungs- 
werte ist durch die Überlegung möglich, dass bei der Kae. der Ober- 


grenze diese nicht kleiner werden kann, wenn E(X|w, Z< t) durch E —-|w,z < t) 

ersetzt wird. In Analogie dazu kann bei der Bestimmung der Untergrenze 
: : t 

E(2|w,z >t) durch SL 3 Je. > d ersetzt werden. Bis auf die Faktoren —— 

min 


t E 
bzw. SC entsprechen die Grenzen dem Stichprobenmittelwert. 


max 
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Tabelle 3.7: Vergleichende Darstellung nichtparametrischer Obergrenzen in der allgemeinen Form und fiir zwei Spezialfille 


ae MTS-MTR CMTR 


Ki. Pas tlw + Ely|w,z = t): P(z = tlw K; -P(z< tlw + Ely|w,z 2 t)-P(z2 tlw Kı Plz > tlw + Bly|w,z = OU. Pla < dw 
=K]; -P(z < tlw) + E(y|w,z = t)- Plz = de) =K, -P(z < {w)+ E(ylw,z = t)- P(z = tw) =K] -P(z > {w)+ E(ylw,z = t)- P(z = de) 
Lë -P(z > de) + E(y|w,z > t)- Plz > tw) + Elylw,z = t)- Plz < de) 


Ky |1- P(z = tmin |w )]+ Kı |1- P(z = CH + 
Elylw,z = t nin ). Plz = tmin|W) pe Z= Je P(z = ah 
Lët i-P(z = tmax|W) Ki i- Plz tar lw) + 

Elylw.z = t nax ). P(z = tmax|W) Elle. = tmax LB = tmax lw) 


= z>t)-Plz>t{w)+ CES < rt < tlw)+ 


E(y|w,z =t). Plz < tw) 


Ts 


oo ` 


E(y|w,z > t)- Plz > tlw) 


Eļlyw) E(ylw) 


t- SÉ < tmax } I = P(z = tmax|w)l+ 


Elle, a tad 
E(y|w,z = tmax ): P(z = t max |W) 


SST 


SS9IIEe oO CIA 
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Tabelle 3.8: Vergleichende Darstellung nichtparametrischer Untergrenzen in der allgemeinen Form und für zwei Spezialfälle 


Ko Pas dw +E ylw,z=t -Plz = tlw 
=Ko -P(z > del E(y|w,z = t)- Plz = de) =Ko -P(z > del E(y|w,z = t)- Plz = tw) =Kọ „Plz < tlw) + E(y|w,z = t)- Plz = tlw 
+Ko „Plz < de) + E(y|w,z < t)- P(z < de + E(ylw,z = t)- Plz > de) 


E(y|w,z = tan) P(z = tin |W) E( W,Z= ck P(z = t min DN 
Ko |1- Plz = tmax|w) Ko -[I-P(z = tmax|w)l+ 
Elylw,z = t ax ). Plz = tmax|W) E(y|w,z = t)-P(z = tmax|w) 


mm 
il , E(y|w,z < t). P(z < {w)+ t- SEI > t) : P(z > {w)+ | d 
W,Z= 
Term) gn dëse Ehe scdëbzie © 
Bee 1 ) t= Pisses 
= tmin E(ylw,z = tmin ) ' ER EE Pee tin) + Elylw, z= tmin) 
Elylw,z = tmin ): Plz = tmin|W) 


9ST 
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Tabelle 3.9: Abschätzung der Obergrenze von CMTR 


EI P(z < t|w)+E E(y|w, Z2 t)- P(z 2 de) 


-Ely |w, z<t) P P(z < t|w)+ E(y |w, zt): P(z > tw) 


dE lw,z> d P(z > tw)+ Elylw,z < t): P(z < tlw) 


: -E( W,Z> t)- Plz > {w)+ E(y|w, z < t)- Plz < de 
ax 
min ' h = Plz = tmin|w)]+ E(ylw,z = t min ): P(z = t min lw) 


“Ely Iw, z > taita) l- P(z SS tmin|w) hs Ely |w, Z = tmin /' ) Plz = = fmin lw) 
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3.2.7.2 Vergleich der Obergrenzen fiir Erwartungswerte 


Im Folgenden werden die wichtigsten Unterschiede in den Differenzen der 
Obergrenzen der Treatmenterwartungswerte herausgearbeitet, die aus der Ver- 
wendung der verschiedenen Annahmen resultieren. Auf die Analyse der Unter- 
schiede in den Differenzen der Untergrenzen wird aus Symmetriegriinden ver- 
zichtet. 


Tabelle 3.11 zeigt die Differenz zwischen der Obergrenze im Worst-Case-Fall 
und den fünf anderen Annahmen. Im allgemeinen Fall ergeben sich im Normal- 
fall immer Verbesserungen der Obergrenze. Dies gilt auch für die Betrachtung 
der Extremstellen der Treatmentvariablen, bis auf die beiden schon in Abschnitt 
3.2.7.1 angesprochenen Fälle der Obergrenze bei tnax aufgrund MTR und tun 


aufgrund MTS, bei denen keine Verringerung der Obergrenze möglich ist. 


Es ist auch direkt ersichtlich, dass sich die Differenz zwischen Worst-Case- und 
MTS-MTR-Grenze additiv aus der Differenz zwischen Worst-Case und MTS 
und Worst-Case und MTR zusammensetzt: 


IK, = E(ylw,z > di P(z > t|w)+ [K, = E(y W,Z= t)]- P(z < tlw) > 0. 
Worst-Case-MTR Worst-Case-MTS 


Insoweit ergibt sich aus der Verwendung von MTS-MTR - bis auf die beiden 
Extremstellen der Treatmentvariablen — immer eine Verringerung der Grenze 
gegenüber MTS bzw. MTR. Für CMTR gilt dasselbe im Vergleich zu MTR. Die 
Differenz ist - zur Ausnahme siehe den Kommentar zum direkten Vergleich von 
MTR und CMTR - mindestens so gross wie bei Worst-Case-MTR: 


IK, =f: E(2\w,z < Al P(z < tlw)+ [K, = E(y w,z> d P(z > tlw) > 0. 
zusätzlich Differenz Worst-Case-MTR 


In Tabelle 3.12 stellt die Obergrenze des Treatmenterwartungswertes aufgrund 
MTR die Referenzgröße dar. Da die Information von MTR auch in der Ober- 
grenze aufgrund MTS-MTR enthalten ist, kann es — wie in Abschnitt 3.2.7.1 
schon angedeutet — durch die Verwendung von MTS-MTR nicht zu einer Erhö- 
hung der Obergrenze kommen, d.h. die Differenz ist mindestens Null. 
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Tabelle 3.11: Nichtparametrische Obergrenzen im Vergleich mit den Worst- 
Case-Grenzen 


Worst-Case 
[K; - E(ylw, z> d P(z > {w)> 0 


DN — Elylw,z > tinin )- P(z > tinin lz 0 


RE E(y|w, z = t)]-P(z < tw) > 0 


IK; - Elylw,z > tmin )}-- Pte = tminlw)]2 0 
[K, - E(y|w,z = tmax |--PC = tmax|w)]2 0 


K dE < d ` P(z < del 
[Kı = E(ylw, Z> t)]- P(z > {w)> 0 


kp Elylw, Zz > tainh Plz > tmin DÉ 0 


—tmax ‘E ED dds eee In Plz < tmax|w)> 


[K; - E(y|w,z = t)]-P(z # tlw) > 


[Ky Sale, = tmin lh P = tmin|w)]> 0 


[Ki hinen P= zelt 
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Interessant ist der Vergleich zwischen den Annahmen MTR und MTS. Da bei 
der Annahme von MTR das Maximum K, bei den Personen mit z>t durch 
empirische Evidenz ersetzt werden kann und bei Annahme von MTS bei den 
Personen mit z<t, ist es nicht tiberraschend, dass die Obergrenze aufgrund An- 
nahme von MTR für kleinere Werte der Treatmentvariablen kleiner und bei grö- 
Beren Werten der Treatmentvariablen größer als bei Annahme von MTS ist. Für 


t= tnin ist die Obergrenze aufgrund Annahme von MTR höchstens so groß wie 
bei Annahme von MTS und für t= tpa mindestens so groß wie bei Annahme 
von MTS. 


Der Vergleich zwischen den Annahmen MTR und CMTR ist insofern ein Son- 
derfall, als bei Gültigkeit der Konkavität die Obergrenze aufgrund der Annahme 
von CMTR höchstens so groß wie bei Annahme von MTR sein kann, bei Ver- 


letzung der Konkavität El W,Z< t)> K, gelten und sich somit eine größere 
Obergrenze aufgrund CMTR ergeben kann. 


Dasselbe gilt für den Vergleich zwischen den Obergrenzen bei Annahme von 
MTR und ETS. Ist die Responsefunktion monoton, so gilt: 


IN = Elylz = di. P(z <t)+ [E(ylz > t)- E(ylz = d P(z>t)>0. 


Ist die Monotonieannahme jedoch nicht erfüllt, gilt [E(ylz > t)- Eyz = t)]< 0 


und damit ist eine kleinere Obergrenze aufgrund der Annahme von MTR als 
aufgrund der Annahme von ETS zumindest theoretisch nicht auszuschließen. 


In Tabelle 3.13 ist die Obergrenze aufgrund MTS die Referenzgröße. Da die 
Annahme monotoner Selektion auch in MTS-MTR enthalten ist, gilt wie beim 
Vergleich MTR und MTS-MTR, dass sich bei der Annahme von MTS-MTR 
keine größeren Obergrenzen ergeben können. Im Unterschied zum Vergleich der 
Annahmen von MTR und ETS ist es beim Vergleich der Obergrenzen bei MTS 
und ETS auch bei einer Verletzung der Annahme von MTS nicht möglich, dass 
die Obergrenze aufgrund MTS unter die Obergrenze von ETS sinken kann. Dies 
liegt daran, dass bei der Annahme monotoner Selektion im Gegensatz zur 
Annahme der monotonen Responsefunktion für die Personen mit z<t, z>t bei 
MTR, anstelle K, nicht der Erwartungswert der Responsevariablen 


Ely|w, Z< t], sondern Ely W,Z= t] verwendet wird. 
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Tabelle 3.12: Nichtparametrische Obergrenzen im Vergleich mit den MTR- 
Grenzen 


- Elylw,z = let < t}w)-[K, - Elylw, z > t)]- Plz > tw) 
- Hale z > t min | -PE = tin w)] < 0 


[Ki biss = tmar base 


Ik, glas db <tlw)20 
ge RE 


Kı - E(y|w,z = tmax )}- [1 - Plz = tmax|w)]> 0 


rt 


ETS tain lE(yIw,z ln )- E(y|w,z ta )l Plz > tmin DN 
- E(ylw, Z = t max )- h- P(z = tmax |w)]> 0 


Dies entspricht dem Wert, der fiir die Personen mit z<t bei MTS-MTR 
verwendet wird, so dass sich die Obergrenzen nur hinsichtlich der Personen 
unterscheiden können, deren realisiertes Treatment z größer als t ist und für die 


t max 
ki -t SC z< rt del 20 


wegen MTS K, und bei MTS-MTR wegen MTR E( W,Z> t) verwendet wird: 
K: P(z > t|w)+ E(y E t)- P(z = {w)+ E(y E t). P(z < tlw) 
- E(y|w,z > t): P(z > tlw)- E(y|w,z = t): P(z = tw)- Elylw,z = t): P(z < tlw) 
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Dasselbe gilt fiir den Vergleich mit der Obergrenze aufgrund ETS. Die Diffe- 
renz zu ETS ist bei Gültigkeit der Monotonie der Responsefunktion noch größer 
als zu MTS-MTR: 


[K, - Side, zz t)]- P(z > tlw)< [K, - E(y|w, z = t)]- P(z > tw) 
MTS zu MTS-MTR MTS zu ETS 


Offen bleibt der allgemeine Fall der Differenz zwischen MTS und CMTR. Hier 
ist E( E t)< EM ) nicht auszuschließen. 


Tabelle 3.13: Nichtparametrische Obergrenzen im Vergleich mit den MTS- 
Grenzen 


BE 


E ET 
MTS 
- Tm [Ky = E(ylw,z An J]. fi — P(z = tmin|W lz 0 
MTR 
C  , — 


Bbw, 


k,- 


=t)- t- di |w,z < dek < del 
E(y|w, z> dl. P(z > de 


tmin [Kı -E Elylw, Z > tmin )}: 1 - P(z = = tmin|w lz 0 


È (ylw,z = tmax )- E < tmax ] i- = t max |W)] 


allgemein 


CMTR |, 


ax 
[K, - Elyw,z=t)|-P(z> tlw)>0 
ETS |t=tmin [K] - Elylw,z = tmin LD — Plz = tmin|w)]2 0 
pep 
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Beim Vergleich der Annahmen von MTS-MTR und CMTR gilt wieder, dass 
E(y|w,z=t)<t- Bl 
mit der Annahme von ETS bei Giiltigkeit der Monotonieannahme die Ober- 
grenze bei Annahme von ETS immer kleiner ist, bei Verletzung der Monotonie- 
annahme größer sein kann und im Fall t= tnax der Obergrenze aufgrund ETS 
entspricht. 


Tabelle 3.14: CMTR und ETS im Vergleich mit den MTS-MTR-Grenzen 


e 


eiie- = t)- t- SEI < 3] . P(z < tlw) 
omia JL 


së Z= tmar )| -P(e = tma] 


[E(ylw, Z= t)- E(y|w, z < d. P(z < de) 
[E(ylw, z =t max )- Elle, < tinax )- Plz < tnax |w) 


Beim Vergleich der Annahme von CMTR mit ETS gilt, dass für t=t,,, nur bei 
Gültigkeit der Monotonieannahme die Obergrenze bei CMTR nie kleiner als bei 
ETS sein kann. Bei t= ta gilt dann umgekehrt, dass bei Gültigkeit der Mono- 


tonieannahme die ETS-Obergrenze nie kleiner als die CMTR-Obergrenze sein 
kann. 


t= tn 


T 3.15: Vergleich der a een mit ETS 


y — a See )- Bly|w,z = t)]-P(z> tlw) + 
EEN H Em )- g = ) -P(z < tlw) 


E(y|w, min )- Ely |w, SCH li- P(z = Gegen 


paima) Elle, = reell ll - P(z = teen 
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3.2.7.3 Übersicht über die Obergrenzen für Treatmenteffekte 


Da die Untergrenze des Treatmenteffekts bei den meisten Annahmen nach unten 
durch Null begrenzt ist, werden bei den Treatmenteffekten in diesem und dem 
folgenden Kapitel nur die Obergrenzen dargestellt und verglichen. Wie bei der 
Analyse der Grenzen der Treatmenterwartungswerte ergeben sich beim Treat- 
menteffekt an den Extremstellen tmin und tnax Vereinfachungen und Spezial- 
fälle. Ist die Treatmentvariable zudem binär, d.h. es fällt der Mittelbereich 
tin <t<tmax Weg, erhält man zusätzliche Vereinfachungen und Spezialfälle, 
die im Folgenden besprochen werden. 


Die Annahme von MTR führt sowohl bei einer binären Treatmentvariablen als 
auch bei der Betrachtung von tmin und tmay zur Obergrenze des Worst-Case- 
Treatmenteffekts. Die Annahmen von MTS und MTS-MTR ergeben in beiden 
Fällen den ETS- Treatmenteffekt, d.h. obwohl eine Annahme über die Selektion 
getroffen wird, die von exogener Selektion abweicht, erhält man als Obergrenze 
den Treatmenteffekt, der auf exogener Selektion basiert. Bei der Annahmen von 
CMTR erhält man als Obergrenze des Treatmenteffekts bei einer binären 
Treatmentvariable den Ausdruck (t, -t,)- E(y/ z\w), den man als Hochrechnung 


der jahrlichen Bildungsertragsrate E(y/ z|w) interpretieren kann. 


Tabelle 3.16: Allgemeine Form und Spezialfälle der nichtparametrischen 
Obergrenzen 


(2 
t2 


allgemein 


2 Treatments 


ti = tmin t2 = t max 
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Tabelle 3.16 (fortgesetzt): 


Worst-Case 


E(y|w,z = tat P(z = to|w)+ Kı Plz # t2|w)- 

[Eylw,z=t,)-Plz=tı|w)+Kg-Plz#tılw)] 
2 [E(y|w,z = tz )~Ko]-P(z = tsch 

Treatments [Ky —E(y|w,z = ty )]- P(z = ty|w) 


allgemein 


E(ylw,z = a) Plz = t nax Iw)+ Ki .P(z # t max|W)— 
E(y|w,z = tmin L P(z = t min|W)— Ko -P(z # tmin|W) 


Tabelle 3.16 (fortgesetzt): 


2 
Treatments 


Ky -P(z > to|w)+ Elylw,z = tal: Plz < tə|w)- 
allgemein Ko Pis < tılw)- Elylw,z = t| Plz = tlw) 


MTR 


K, -P(z tel Elle. > t2): Plz > t2|w)- een 


[ko -Plz rel Elyjw,z < t,)-Plz< le) 

Elle, z— tz )—Kg -P(z = t|w) 
Ee eal) 
(Ki —Ko)-P(tmin < Z < tmax|w)+ 


+ 
Worst-Case-Obergrenze 


[E(ylw,z = tmax )- Kal Plz= t max \w)+ Worst-Case-Obergrenze 
IK, = Elle. ae l P(z = tmin DN 


E ylw,z =t,)-E ylw,z <tj 
[E(yw,z=t2)- Elylw,z = ul P(t) <z<t2|w)+ 
[E(ylw,z > Seck E(ylw,z =t] Int > Gul 


-Plz<tj|w + 


Elylw,z=t,]- Elylw,z = tı | ETS-Treatmenteffekt [E(y|w.z = t2)- Ely|w,z = tı | ETS-Treatmenteffekt 


Elylw,z = tmax |- Ely|w, z = tmin | ETS-Treatmenteffekt 


[E(y 


W,Z = tmax )- Bly 


MTS-MTR 


W, 22 t min )) ETS-Treatmenteffekt 


col 
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3.2.7.4 Vergleich der Obergrenzen fiir Treatmenteffekte 


In diesem Kapitel soll nun systematischer als in den entsprechenden Abschnitten 
untersucht werden, inwieweit sich die Obergrenzen der Treatmenteffekte auf- 
grund der verschiedenen Annahmen unterscheiden. Dabei werden wieder wie im 
vorigen Kapitel sowohl die allgemeinen Unterschiede als auch die beiden Spe- 
zialfalle einer binären Treatmentvariablen und der Betrachtung des Treatmentef- 
fektes bei tmn und Le herausgearbeitet. Da sich die Obergrenze des Treat- 


menteffekts bis auf die Annahme von CMTR immer als Differenz der Ober- 
grenze des Treatmenterwartungswertes an einer Stelle t=t, und der Unter- 
grenze des Treatmenterwartungswertes an einer Stelle t=t, ergibt, kann erwar- 
tet werden, dass sich die Ergebnisse aus Abschnitt 3.2.7.2, in dem untersucht 
wurde, wovon die Unterschiede in den Obergrenzen und Untergrenzen der 
Treatmenterwartungswerte abhängen, in der Analyse der Unterschiede bezüglich 
der Obergrenze des Treatmenteffekts widerspiegeln. 


Da beim Worst-Case-Fall keine Annahmen über die latenten Größen getroffen 
werden, wird wieder zuerst die Obergrenze des Treatmenteffekts im Worst- 
Case-Fall als Referenzgröße verwendet und untersucht, welche Verringerung 
dieser Obergrenze die anderen Annahmen bewirken. 


Die Annahme von MTR führt in den beiden Spezialfallen tnin 


ner Verbesserung, da sich, wie bereits in Abschnitt 3.2.7.3 gezeigt wurde, die 
Obergrenzen und Untergrenzen dann entsprechen. MTR führt nur dann zu einer 
Verbesserung, wenn es noch Treatments größer als t, bzw. kleiner als t, gibt, 


da in diesen Fällen die empirische Evidenz (y ;) K, bzw. K, ersetzt. Dies ergibt 


und thax ZU kei- 


sich zum einen aus der Betrachtung der allgemeinen Darstellung der Differenz 
in Tabelle 3.17 als auch aus Abschnitt 3.2.3.1. 


Dagegen lässt sich feststellen, dass durch die Annahmen von MTS, MTS-MTR, 
CMTR und ETS in jedem Fall die Obergrenze des Treatmenteffekts verringert 
wird. 


Verwendet man den ETS-Treatmenteffekt, der die Untergrenze für die Ober- 

grenze des Treatmenteffekts aufgrund der Annahme von MTS-MTR darstellt, 

als Referenzgröße, erhältman ebenfalls ein Ergebnis, das direkt aus Abschnitt 

3.2.7.3 resultiert. Bei den beiden Spezialfällen ergibt sich aufgrund der Annah- 

men MTS und MTS-MTR kein Unterschied zum ETS-Treatmenteffekt und da- 

mit erhält man auch das Ergebnis, dass in beiden Spezialfällen die Obergrenze 
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aufgrund MTR mindestens so hoch ist wie aufgrund MTS. Allgemein muss dies 
nicht gelten. Tendenziell gilt, dass der Unterschied abnimmt, bzw. die Ober- 
grenze aufgrund MTR kleiner als aufgrund MTS sein kann, je mehr Treatments 
zwischen t, und tmas bzw. tmin und tį liegen. Dies drückt sich nach Umschrei- 


ben der in der Tabelle angegebenen Differenz in dem Bestandteil 


DN + Ky - E(ylw,z = t,)- E(ylw,z = d) P(z < tiw) 
+ [E(ylw,z = Of E(ylw,z 2 SG Ky ~K,]-P(z > t,|w) 


aus, der als einziger negativ werden und damit dafür sorgen kann, dass die 
Obergrenze aufgrund MTR unter der Obergrenze von MTS liegen kann. Für den 
Fall, dass lediglich zwei Treatments vorhanden sind, ist die Obergrenze bei 
MTR mindestens so groß wie bei MTS. 


Tabelle 3.17 zeigt, dass logischerweise die Obergrenzen aufgrund MTS bzw. 


MTR nie kleiner als die Obergrenzen aufgrund der Kombination von MTR und 
MTS sein können, und allgemein die Differenz zwischen MTS und MTS-MTR 


D u E(y 


w,z >t, )|-P(z > t,|w)+[E(ylw,z < t,)—K,]-P(z<t,|w) 


ist, da dies genau die Information ist, die aufgrund der Hinzunahme der MTR- 
Annahme die Obergrenze des Treatmenteffekts gegenüber MTS verändert und 
die bei der Betrachtung der beiden Spezialfälle wegfällt, so dass der Unterschied 
zwischen MTS und MTS-MTR verschwindet. 


Da bei CMTR im Vergleich zu MTR ebenfalls insofern mehr Information einge- 
setzt wird als K, bzw. K, durch empirische Evidenz, gepaart mit der Annahme 
über die Konkavität, ersetzt wird, kann die Obergrenze aufgrund CMTR nicht 
größer sein als aufgrund MTR. 
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Tabelle 3.17: Differenz zwischen den Worst-Case-Obergrenzen und alternativen nichtparametrischen Obergrenzen fiir 
Treatmenteffekte 


Worst-Case 


bie sz rb talw)+ besen L- Kol pb del g 


[Kı B(y|w, z = tz pls < talw)+ [E(ylw,z ty) Ko]-Plz>tılw) 


[ky -Elyw.z=t2)]-P=tlw)+[Elyw,z=t1)-Kol-Plz=t2|w)20 


D =tmin 
t2 = max 


= Lesch le [E(y|w,z = tmin )- Kalb - Plz = tmin|w)]2 0 


Pity SEILER + 
IO ~ Ko)- {E(y|w, z >to )- Elylw,z = voll, P(z > Gel IO -Ko)- {E(y|w, z = Go E(y|w, z < tı )}]- Plz < tılw)+ 
[kK - E(y|w,z = Gl, Plz = tılw)+ [E(y|w,z = tı)- Kol: Plz = to|w)> 0 
— Elle, 2 = ta Lëtz = ty|w)+ bie, = t1)-Ko} PG = talw) 
-Pltmin < Z < tmax|w)+ 
7 E(y|w,z = t max )- Plz = tmin Iw)- [E(y|w,z = tmin )- Ko]: P(z = tmax ls 0 


[Kı 


WV PP:ZE:70 6LOZ/LL/LO Ye Alopegand WON} papeojumoq 


V-9LVSL-LE9-E-8Z6 - UHIM UEYHO}S 


[kı 


891 


SSOIIE oO CIA 


WYVPP:ZE:70 6LOZ/LL/LO Je Alopegand woy papeojumoq 


V-9LVSL-1LE9-E-8Z6 - UHIM UƏHƏJS 


Tabelle 3.17 (fortgesetzt): 


Worst-Case 


)}-P@ > talw) d (yIw,z= t2)- ul Biesen rb taw)» 
déi 


In z<tlw)- [Eilwz=t)-Plz=tilw)+Ko-Plz#tjw)]) 20 
Untergrenze unbedingter Erwartungswert Worst-Case-Fall für ty 


Ge (2-14) u BS P(z ill Ki - (t2 - ty): É ell scht, 
[E(y|w, z = ty )-[1- P(z = the la. Ko -PC = the 


EZ =1,)-(t, -t,)- SE = Ko | PC = GDL (Geh). SEIN Elylw,z = d erch 


Allgemein 


2 Treatments 


20 


t= tain Elylw,z = t max -E y|w EE tmax |W +[Kı -E y|w . 
t2 =tmax [E(y|w,z = tmin ) He = tmin Iw)+ Ko: P(z # tmin w)l> 0 


-P(z#t) Az#t,) 
+[E(ylz = tı)-Ko} PE = tp) +[K -Elz = ty Lët = ty) 
Jk, -F(y|w,z = tz J|- P(z = t;|w) + [E(y|w,z = t})—Ko]-P(z = ta|w)2 0 
(Ky - Ko )- {E(y|w, 2 = tmax )- Ely|w.z = tmin Jf Pltmin < Z < tmax|w)+ 
[Ky —E(ylw,z = tmax PS = tmin|w)+ [E(y|w. z = tmin )- Kal Plz = tmax|w)2 0 


Allgemein 


691 


SS999e oO CIA 


WYVPP:ZE:70 6LOZ/LL/LO Je Alopegand woy papeojumoq 


V-9LVSL-LE9-E-8Z6 - UHIM UEHO}S 


Tabelle 3.18: Differenz zwischen nichtparametrischen Obergrenzen fiir Treatmenteffekte und Exogener Treatmentselektion 


Kı — Elylw,z = t3 Pis < taļw)+ [Elylw, z > t2)- Elyw,z=t2 }}- Plz > t2|w 
+[B(ylw,z = tı)- Elyz < Al P(z< tılw)+ [E(y|w,z = ty )—Kg]-P(z > Goler) 


[Ky - Side 2 = ta)}- P(e =t)|w) + ider. —p Kal pb cl 


K; - Elylw,z =f max L P(z < Eet [w)+ (E(y|w.z = tmin )- Kol, P(z > linia Iw)20 


allgemein [Ky - Elyw,z = t2 |} P > t2|w)+[E(ylw,z=t1)-Ko]-P(z < tılw)20 


SZ 


ti =tmin 


t2 =tmax 


[E(yjw, z = t1)- E(y|w,z < ty] Plz < ty{w)+[E(y|w,z > t2)- Elylw,z = t2 Lëtz talw) 


allgemein 


OLT 


SSOIIE oO CIA 


WV PP:ZE:70 6LOZ/LL/LO Je Alopegand woy papeojumoq 


V-9LVSL-LE9-E-8Z6 - UHIM UEYHO}S 


Tabelle 3.18 (fortgesetzt): 


fei EE ) P(2> talw)+ 

ETS-Treatmenteffekt 

allgemein 

| l pl SZ < D [E(ylw, zt )-E(ylw,z = ty (o < talw) 

CMTR ETS-Treatmenteffekt 

BH Treatments 6 — ul ER w)- [E(y|w, 2= t2)- E(ylw,z =tj ) 
ETS-Treatmenteffekt 
D —tmin )- (Zw) = [E(ylw,z = t max )- E(ylw,z = tmin d 
ETS—Treatmenteffckt 


Tabelle 3.19: Differenz zwischen den Obergrenzen bei Annahme von MTR und MTS 


K, -E ylw,z= to fe 
+ [E(y|w,z =t] )-Kol Plz > t)|w)- [E(y|w,z <ti )-Kol- Plz < tılw) 
[kı = Elylw,z = ty)]- Plz = ty|w)+ [E(ylw,z = ty )- Kal P(z = Gelz 0 


= Elylw,z = t max L P(z St Iw)+ [Elylw,z Stan E P(z > tmin Dy 


Kı - Ely|w,z.> ty Pe > Gw 


allgemein 


2 Treatments 


[kı 


IZI 


SS9IIE 9d] CIA 


WV PP:ZE:70 6LOZ/LL/LO e Alojoe4qnd woy papeojumoq 
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Tabelle 3.20: Differenz zwischen den Obergrenzen bei Annahme von MTR und MTS-MTR 


2 Treatments 


[K, -Elylz=t2)}-Plz<t2)+ et = ty )-Ko]-P(z > t)20 
[ky - E(yjz = ta)}- Pz = ty)+ bk = tı)-Ko] P(e = tz )20 
[Ky = E(ylz = t2 )}- P(z < tmax )+ [E 


(yz = ty )-Ko]-P(z> tmin )2 0 


Tabelle 3.21: Differenz zwischen den Obergrenzen bei Annahme von MTS und MTS-MTR 


bk, -E(y EE tz )]- P(z > to|w)+ [E(y|w,z < tı)-Kol-Plz < ty|w)2 0 


2 Treatments 0 


D =tmin» t2 = tmax 0 


CLI 
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Tabelle 3.22: Differenz zwischen den Obergrenzen bei Annahme von CMTR und MTR 


K afet} SEI < cl P(z< Gell Bbw. z sb) los E < tn} PG = ta|w)+ 


eiis: >to )-( SCH -E(y|w,z> ty ji P(z > to|w)- [Kg -P(z> ty]w)+ B(ylw,z < pn Lëtz spe 
Untergrenze unbedingter Erwartungswert MTR für tı 


allgemein 


D -(t, Eh -P(z=t3|w) Ji =ty)-(ty SEO = tp|w)- 


[Ky -fl-P@= tılw)l+ E(y|w,z =t,)-P(z = tilw)] 


Worst-Case-Untergrenze für tı =tmin 


[Ki (mac = tmin d- ED EE E(w ) |- Ple = trax tw) 


[Kg -[I-P(z= tmin|W)|+ E(y|w, z = tmin )- Plz = tmin|w)] 


Worst-Case-Untergrenze für tj=tmin 


2 Treatments 


Tabelle 3.23: Vergleich nichtparametrischer Obergrenzen für Treatmenteffekte bei Annahme von CMTR und MTS 


K Jl E(ylw,z > vlt P(z > Geh (bie, = to)-(ty = tı} di W,ZS t2) PG < to|w)- 
[Ko „Plz < tılw)+ Elle, = tı) P(z > ol 
Untergrenze unbedingter Erwartungswert MTS für tı 


E(y|w,z = t2)-Elylw,z=t))- (tz -t)): SEI 
ETS-Treatmenteffekt 


Allgemein 


2 Treatments 


D =tmin = 0 
t2 = tnax 


eee eee 
CMTR —Treatmenteffekt 


Elylw,z = t max je Elylw,z = tmin )- (tax -tmin ): dy 


ETS-Treatmenteffekt 
CMTR -Treatmenteffekt 


CLI 


SS9IIE 9d] CIA 
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Tabelle 3.24: Differenz zwischen den Obergrenzen bei Annahme von CMTR und MTS-MTR 
| (3 ebe 12)-EQiw.z=t)]-P2> rel 
EIZ = t3 )- Elylw,z = PEE E( Zw, < D P(t) <z< to|w)+ 
[Bbw = t>)- Elylw,z <ti Hi -tı) SEI £ OI < tiw) 


Elyw,z=t2)-Elyw,z=t1)- (12-01): ED 
ETS-Treatmenteffekt 


allgemein 


2 Treatments 


CMTR -Treatmenteffekt 


E(y|w,z = tmax )- E(y|w,z = tmin )- (tax — tmin ): dy 
ETS-Treatmenteffekt 


CMTR -Treatmenteffekt 


GO 
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3.3 Identifikation bei fehlerbehafteten Daten 
3.3.1 Einfiihrung 


Die Beriicksichtigung von Fehler-in-Variablen-Problemen und die Verwendung 
von robusten Methoden sind inzwischen tibliche Verfahren bei der Schätzung 
von Lohnfunktionen. Im Folgenden wird untersucht, wie sich fehlerbehaftete 
Daten™ auf die nichtparametrische Identifikation von Wahrscheinlichkeiten und 
D-Parametern und damit auf die nichtparametrische Identifikation von D-Treat- 
menteffekten auswirken. Es werden zwei Datenfehlermodelle, Verschmutzung 
und Korruption, betrachtet, die auch im Bereich der robusten Verfahren verwen- 
det werden. Damit werden Vergleiche mit den Ergebnissen aufgrund der im em- 
pirischen Teil verwendeten Quantilregression, einem robusten Verfahren, mög- 
lich. Unter Verschmutzung ist ein Datenfehlermodell zu verstehen, bei dem das 
Auftreten von Datenfehlern unabhängig von den Realisationen der einwand- 
freien Daten erfolgt und somit die interessierende Verteilung nicht beeinflusst, 
unter Korruption ein Fehlermodell, bei dem nicht ausgeschlossen wird, dass 
Datenfehler die zu analysierende Verteilung verändern. Übersicht 3.4 beschreibt 
die Verwendung dieser beiden Datenfehlermodelle im Rahmen der robusten 
Methoden. 


Übersicht 3.4: Charakterisierung der im Rahmen der robusten Verfahren ver- 
wendeten Datenfehlermodelle 


Datenfehlermodelle 


Verschmutzung Korruption 
Contaminated Sampling Corrupted Sampling 


Einfluss- und begrenzte 
Einflussfunktionen, (Influence, 
Bounded Influence Functions) 


Bruchpunktanalysen 
(Breakdown Point) 


Wie groß ist der Einfluss einer Wie groß darf der Anteil an 
Beobachtung, die zu einer großen Datenfehlern maximal sein, ohne 
Stichprobe hinzugenommen wird, auf) dass eine Schätzfunktion über einen 
eine Schätzfunktion (Gross Error bestimmten Wert hinaus verändert 

Sensitivity)? wird (Bruchpunkt)? 


10% Hampel et al. (1986) gehen davon aus, dass ein Anteil an Fehlern zwischen 1% und 10 % 
bei Daten eher die Regel als die Ausnahme darstellt. 

me Vgl. Huber (1981), S. 13 zu den Definitionen der Einflussfunktion und des Bruchpunktes, 
sowie Donoho/Huber (1983) und Hampel et al. (1986) zu alternativen Definitionen des 
Bruchpunktes. 
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Der von Horowitz/Manski (1995) vorgestellte Modellrahmen eignet sich nicht 
nur fiir die dort verwendeten CPS-Daten mit Ihren Besonderheiten, sondern ist 
von weit allgemeinerem Interesse. Dies zeigt sich in der Anwendung auf Daten 
des Sozio-oekonomischen Panels. Hier erhält man als Spezialfall des korrum- 
pierten Stichprobenmodells Ergebnisse aus der Identifikationsanalyse zensierter 
Stichproben. Des Weiteren wird in Abschnitt 3.3.1 gezeigt, dass die maximal 
mögliche Differenz der Intervallbreiten für Wahrscheinlichkeiten bei Korruption 
und Verschmutzung für einen Fehleranteil von 29,29 % 17,16 Prozentpunkte 
beträgt. 


Der Frage, warum beispielsweise zugunsten der Identifikation von Grenzen für 
den Erwartungswert auf eine robuste Punktschätzung verzichtet werden sollte, 
wird in Abschnitt 3.3.4 nachgegangen. Anhand der Diskussion der Unterschiede 
in der prinzipiellen Vorgehensweise wird gezeigt, dass die Identifikationsana- 
lyse ermöglicht, Grenzen für Quantile und den Erwartungswert der interessie- 
renden Verteilung zu identifizieren, während die robusten Methoden lediglich 
erlauben, den Parameter der identifizierten Verteilung konsistent zu schätzen. 
Zudem wird deutlich, dass die Identifikationsanalyse ihren Fokus auf ex-post 
Inferenz legt, während die robusten Methoden insoweit zu konservativ sind, als 
sie schon ex-ante versuchen, den Einfluss von Fehlern zu begrenzen. 


In Abschnitt 3.3.5 werden erstmalig Konfidenzintervalle für die Unter- und 
Obergrenzen aufgrund der verwendeten Datenfehlermodelle angegeben. Da es 
bislang noch keine analytischen Grundlagen zur Konstruktion von Konfi- 
denzintervallen für diese Grenzen gibt, wird das Bootstrapverfahren verwendet. 
Es zeigt sich, dass die Konfidenzintervalle im Vergleich zu der Intervallbreite 
der Unter- und Obergrenze fast vernachlässigbar schmal ausfallen. Es wurden 
dabei mit gleichem Ergebnis Bootstrapstichproben vom Umfang 100 und 1000 
verwendet. 


Im letzten Abschnitt wird am Beispiel des Worst-Case-Szenarios gezeigt, dass 
die Verwendung des Modellrahmens von Horowitz/Manski (1995) zur Identifi- 
kation von Grenzen für D-Treatmenteffekte zu denselben Grenzen wie im Mo- 
dell zensierter Stichproben führt. 


Steffen Wirth - 978-3-631-75476-4 
Downloaded from PubFactory at 01/11/2019 04:32:44AM 
via free access 


177 


3.3.1.1 Fallbeispiele 


Anhand von zwei Fallbeispielen sollen die Anwendungsmöglichkeiten der Iden- 
tifikationsanalyse bei fehlerbehafteten Daten dargestellt werden. Im ersten Fall 
analysieren Horowitz/Manski (1995) die in Tabelle 3.25 dargestellte Verteilung 
der Haushaltseinkommen von 60.000 Haushalten im Jahr 1990, die das U.S. 
Bureau of the Census auf der Grundlage des Current Population Survey (CPS) 
veröffentlichte. Die CPS-Daten bergen für solche Erhebungen typische Daten- 
fehler. Nach Angaben des U.S. Bureau of the Census verweigerten circa vier- 
einhalb Prozent der Haushalte die Teilnahme an der Erhebung, während circa 
acht Prozent der Haushalte zwar an der Erhebung teilnahmen, jedoch bei der 
Frage nach dem Haushaltseinkommen die Antwort verweigerten. Eine zusätz- 
liche Problemquelle stellt die Vorgehensweise des U.S. Bureau dar, bei all den 
Haushalten, für die aufgrund Antwort- oder Teilnahmeverweigerung keine An- 
gaben zum Haushaltseinkommen vorliegen, ein Verfahren zur Schätzung des 
Haushaltseinkommens zu verwenden, ohne in der veröffentlichten Tabelle 
kenntlich zu machen, welche Haushaltseinkommen geschätzt wurden und wel- 
che aus den Angaben der Haushalte stammen. 


Tabelle 3.25: Verteilung der jährlichen Haushaltseinkommen 1990, CPS, 
U.S. Bureau of the Census!” 
Intervall relative Intervall relative 
(1000 $) | Häufigkeit (1000 $) Häufigkeit 
0,053 55-60 0,032 
0,103 60-65 0,028 
- ; 65-70 0,023 


| 
| 


106 Yo]. Horowitz/Manski (1995), S. 296. 


Steffen Wirth - 978-3-631-75476-4 
Downloaded from PubFactory at 01/11/2019 04:32:44AM 
via free access 


178 


Welche Rückschlüsse lassen sich nun in diesem Fall von der durch das U.S. 
Bureau veröffentlichten Verteilung der Haushaltseinkommen auf die interessie- 
rende!” Verteilung der Haushaltseinkommen unter Berücksichtigung der Daten- 
fehler und der geschätzten Haushaltseinkommen ziehen? 


Das zweite Fallbeispiel verwendet Daten des Deutschen Instituts ftir Wirt- 
schaftsforschung (DIW). Das DIW ermöglicht auf seiner Homepage zu dem 
Sozio-oekonomischen Panel (SOEP) jedermann beispielsweise den Zugang™® zu 
der Verteilung der Haushaltsnettoeinkommen von 7368 Haushalten im Jahr 
1999 in Form der Tabelle 3.26. 


Tabelle 3.26: Verteilung der berichteten monatlichen Haushaltsnettoein- 
kommen, 1999, Soepinfo'” 


Intervall absolute relative 
(1000 DM) Häufigkeit | Häufigkeit 
100 | 0,0142 


| 
pI | 800 | 0,1136 
23 | 139 | 0,1987 
22 


0-1 
1-2 
2-3 

5-7 


9-15 0,0251 
15-99 0,00026 
7041 


327 Haushalte machten keine Angaben zum 
Haushaltsnettoeinkommen. 


107 Mit interessierender Verteilung ist hier die Verteilung der Haushaltseinkommen gemeint, 
die gegeben wäre, wenn alle Haushalte ihr Haushaltseinkommen berichten würden. 

108 Diese klassierte Verteilung für die Variable "Haushaltsnettoeinkommen" (ph50) ist dem 
Programm Soepinfo entnommen, das sich auf der frei zugänglichen Internetseite 
http://www.diw.de/deutsch/sop/soepinfo/ des DIW befindet. Weitere Details zu der Anzahl 
an Haushalten, die 1998 an der Erhebung teilnahmen, 1999 aber ihre Teilnahme 
verweigerten, können der Datei "Methodenbericht 1999.pdf", die auf der Internetseite 
http://www .diw.de/deutsch/sop/service/fragen/ zu finden ist, entnommen werden. Da es an 
dieser Stelle nur um die prinzipielle Vorgehensweise geht, wird diese Information nicht 
berücksichtigt. 

10 Im Gegensatz zu der Tabelle 3.25 sind in Tabelle 3.26 die absoluten Häufigkeiten 
angegeben, um den Anteil der Antwortverweigerer, der im Soepinfo nicht explizit 
ausgewiesen ist, angeben zu können. 
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Auch hier stellt sich die Frage, wie diese veröffentlichten Angaben verwendet 
werden können, um die Verteilung der monatlichen Haushaltsnettoeinkommen 
aller Haushalte analysieren zu können. Zudem werden wir anhand dieses Bei- 
spiels zum einen untersuchen, welche Änderungen sich gegenüber den Daten 
des U.S. Bureau of the Census daraus ergeben, dass das DIW für die 327 Haus- 
halte, die keine Angaben zum Haushaltsnettoeinkommen gemacht haben, keine 
Schätzungen durchgeführt hat, und deshalb die tatsächlich berichteten Haus- 
haltseinkommen identifiziert sind. Dies sollte, interpretiert als Zusatzinforma- 
tion, ein Vorteil gegenüber den Daten des U.S. Bureau sein. Zum anderen kön- 
nen die für jedermann zugänglichen Daten aus Tabelle 3.26 mit den exakten 
SOEP-Daten verglichen werden, die auf Antrag gegen eine geringe Nutzungs- 
gebühr für Forschung und Lehre zugänglich sind. 


3.3.1.2 Problemstellung 


Welche Informationen lassen sich nun aus einer identifizierten aber fehlerbe- 
hafteten Verteilung, im Folgenden mit Q bezeichnet, für Wahrscheinlichkeiten 
und D-Parameter einer interessierenden Verteilung, im Folgenden mit D be- 


zeichnet, gewinnen? 


Den Ausgangspunkt der Analyse von Horowitz/Manski (1995) stellt die Vertei- 
lung der Haushaltseinkommen dar, die das U.S. Bureau of the Census veröffent- 
licht. Die interessierende Verteilung ist, wenn man von fehlerhaften Antworten 
der Haushalte absicht TU die Verteilung der Haushaltseinkommen, die man er- 
halten würde, wenn man die Angaben zum Haushaltseinkommen derjenigen 
Haushalte kennen würde, die 


e Angaben zum Haushaltseinkommen gemacht haben (P, , ), 


e keine Angaben zum Haushaltseinkommen gemacht haben (Po). 


Die Verteilung der Haushaltseinkommen P, ergibt sich dann zusammen mit der 
Wahrscheinlichkeit p, dass ein Haushalt entweder gar nicht an der Erhebung 


!!0 Im Fall, dass zwar alle Haushalte antworten, einige jedoch falsche Angaben machen, wäre 
nicht die Verteilung der angegebenen Haushaltseinkommen die interessierende Verteilung, 
sondern die Verteilung der tatsächlichen Haushaltseinkommen. 
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teilnimmt oder nur die Antwort verweigert, als Mischung der beiden Vertei- 
lungen P,, und Ba" 


(3.269) P= (1-p)- Pi +p: Po 


Wenn man berücksichtigt, dass das U.S. Bureau of the Census für die Haushalte, 
die entweder die Teilnahme oder die Antwort verweigern, anstelle der nicht be- 
obachtbaren, latenten Verteilung der Haushaltseinkommen (P,, ) eine durch Im- 


putationsverfahren ermittelte Verteilung (P,,) verwendet, kann die vom U.S. 


Bureau veröffentlichte Verteilung der Haushaltseinkommen (Q) als Mischung 
der beiden Verteilungen P,, und P,, dargestellt werden: 


(3.270) Q=(l-p)-Pı+p-Pa 


Für den Fall Po = Boa entspricht die Verteilung des Haushaltseinkommens, die 


sich gemäß dem Imputationsverfahren des U.S. Bureau of the Census ergibt 
(Po), der latenten Verteilung der Haushaltseinkommen (P,,), und Teilnahme- 


und Antwortverweigerung hätten keinen Einfluss auf die zu analysierende Ver- 
teilung. Da sich dieser Fall P,) = Da nicht prüfen lässt, stellt sich die Frage, wel- 


che Aussagen über die interessierende Verteilung P, bzw. D-Parameter dieser 
Verteilung ohne Kenntnisse über die Verteilung P,, anhand der identifizierten 
Verteilung Q getroffen werden können. 


Nutzlos für die Analyse der Verteilung P, ist die Identifikation von Q, falls die 


Wahrscheinlichkeit p für einen Datenfehler nicht begrenzt werden kann. In die- 
sem Fall muss p =1 verwendet werden, und für (2) ergibt sich Q = Ba, Aus der 


identifizierten Verteilung Q kann somit nichts über die interessierende Vertei- 
lung P, gelernt werden, wenn die Obergrenze der Fehlerwahrscheinlichkeit eins 


beträgt, da die Verteilung P, nicht von P,, abhängt. Im folgenden Abschnitt 


werden daher Annahmen untersucht, die es ermöglichen, über eine Identifika- 
tion von Q die Verteilung von P, zu analysieren, genauer gesagt, Grenzen für 


Wahrscheinlichkeiten und D-Parameter der interessierenden Verteilung P, ange- 
ben zu können. 
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3.3.2 Identifizierende Annahmen 
3.3.2.1 Verschmutzung und Korruption 


Bei robusten Schätzungen wird häufig angenommen, dass Datenfehler unab- 
hängig von den Stichprobenrealisationen der interessierenden Verteilung auf- 
treten. Bei Gültigkeit dieser Annahme führt die Verwendung der Verteilung P,, 
zu Inferenzzwecken zu denselben Ergebnissen wie die Verwendung der eigent- 
lich interessierenden Verteilung P,: 


3271) P, =P). 


Horowitz/Manski (1995) verwenden wegen dieses Zusammenhangs mit robus- 
ten Verfahren, zurückgehend auf Huber (1981), für Datenfehlermodelle, denen 
Annahme (3.3) zugrunde liegt, den Begriff des "Contaminated Sampling Model" 
und für Datenfehlermodelle, die ohne diese Annahme arbeiten, den Begriff des 
"Corrupted Sampling Model". Contaminated Sampling wird bei der Analyse be- 
grenzter Einflussfunktionen, beispielsweise Huber (1981), verwendet, während 
Corrupted Sampling in Analysen des Bruchpunktes, z.B. Hampel et al. (1986) 
und Donoho/Huber (1983) benutzt wird. 


Aus Annahme (3.271) folgt direkt, dass die Kenntnis der Verteilung P,, die 
Identifikation der interessierenden Verteilung wesentlich erleichtert, da die 
Verteilung P, Bestandteil sowohl der identifizierten Verteilung Q — siehe 
(3.270) — als auch der interessierenden Verteilung P, — siehe (3.269) - ist. 


Während das U.S. Bureau die CPS-Daten so veröffentlicht, dass zwischen ge- 
schätzten und berichteten Einkommen nicht unterschieden wird, und die Ver- 
teilung von P,, somit nicht identifiziert werden kann, ermöglicht die Angabe der 
Einkommen des DIW - von der Klassierung abgesehen — die Identifikation der 
Verteilung P,,, so dass unter der Annahme von Verschmutzung (3.271) auch die 
Verteilung P, identifiziert ist und sich in diesem Sinne — wie schon in Abschnitt 
3.3.1.1 angedeutet — die Zusatzinformation bezahlt macht. 
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3.3.2.2 Der Einfluss der Fehlerwahrscheinlichkeit 


Am Ende des Abschnitts 3.3.1.2 wurde schon gezeigt, dass ohne Obergrenze 
p<sA<l1 für die Fehlerwahrscheinlichkeit die Identifikation von Q zu Q = Poo 
führt, und damit keine Rückschlüsse auf die interessierende Verteilung P, mög- 
lich sind. Kenntnisse über die Fehlerwahrscheinlichkeit sind somit von essen- 
tieller Bedeutung für die Identifikationsanalyse in dem Sinne, dass im Falle der 
Existenz einer Obergrenze A <1 für p schon die Identifikation von Q genügt, um 
die Verteilungen P,, und P, beschränken zu können. 


Im Fall der CPS-Daten kann die Obergrenze A durch die Angaben des U.S. 
Bureau konsistent geschätzt werden. Wenn nach Angaben des U.S. Bureau vier- 
einhalb Prozent ihre Teilnahme verweigerten, entsprechen acht Prozent an Ant- 
wortverweigerern 0,08-(1—0,045)=7,6% aller kontaktierten Haushalte und 
eine konsistente Schätzung der Obergrenze A für p führt zu 


4=45%+7,6% =12,1%. 


Im Fall der SOEP-Daten sind — wie im letzten Abschnitt schon angedeutet - 
andere Informationen gegeben. Während durch die Angaben des U.S. Bureau 
weder P,, noch Ba, sondern nur die Mischung der beiden Verteilungen, identifi- 


ziert sind, stellt die in Tabelle 3.26 identifizierte Verteilung der Haushaltsnetto- 
einkommen direkt die Verteilung P,, dar, d.h. 


(3.272) Q=P,. 


Daraus folgt direkt, dass im Fall des verschmutzten Datenmodells, P, = P,,, die 
interessierende Verteilung P, identifiziert ist: 


(3.273) Q=P,=P. 


Somit müssen nun im Unterschied zu den Daten des U.S. Bureau of the Census 
bei Annahme von Verschmutzung keine Unter- und Obergrenzen für 
Wahrscheinlichkeiten und D-Parameter gesucht werden. 
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Verzichtet man auf die Annahme P, =P,, und lässt bei den SOEP-Daten das 
korrumpierte Datenmodell zu, ergibt sich auch hier aufgrund Q = P,, eine Ande- 
rung gegenüber dem Horowitz/Manski-Beispiel. Die interessierende Verteilung 
P, kann dann bei Korruption anstatt zweistufig in Form von (3.269) und (3.270) 
direkt durch (3.274) analysiert werden. 


(3.269) P, =(1-p)-P,, +p: Pio 
(3.270) Q=(1—p)-P,, +p: Py 
(3.274) P,=(1-p) Q+p: Po 


Da 327 von 7368 Haushalten, also 4,43 Prozent, keine Angaben zum 
Haushaltsnettoeinkommen gemacht haben, geht die identifizierte Verteilung Q 
in diesem Fall mit einem "Gewicht" von 1—A=95,57% und die latente 
Verteilung der Haushaltsnettoeinkommen der Antwortverweigerer mit einem 
"Gewicht" von 4,43 % in die Ermittlung von P, ein. 


Im nächsten Abschnitt wird nun der Frage nachgegangen, wie anhand der be- 
trachteten Datenfehlermodelle Wahrscheinlichkeiten und D-Parameter der inte- 
ressierenden Verteilung P, identifiziert werden können. 


3.3.3 Identifikation von Wahrscheinlichkeiten und D-Parametern 


Abschnitt 3.3.3.1 beginnt mit der Identifikation von Wahrscheinlichkeiten bzw. 
entsprechend den Abschnitten des Kapitels 2 mit der Ermittlung von Unter- und 
Obergrenzen für Wahrscheinlichkeiten, um dann in Abschnitt 3.3.3.2 diese 
Grenzen für D-Parameter zu bestimmen. Anhand der Daten des U.S. Bureau of 
the Census und des Deutschen Instituts für Wirtschaftsforschung (DIW) werden 
die Konsequenzen besprochen, die sich aus der Anwendung der beiden 
Datenfehlermodelle "Verschmutzung" und "Korruption" ergeben. Ein wichtiges 
generelles Ergebnis der nichtparametrischen Identifikationsanalyse unter 
"Verschmutzung" ist die Identifikation einer Unter- und einer Obergrenze für 
den Erwartungswert. 
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3.3.3.1 Identifikation von Wahrscheinlichkeiten 


Zuerst werden Grenzen bei Annahme von Korruption ermittelt. Unter dieser 
Annahme müssen Fehler nicht unabhängig von den Stichprobenrealisationen der 


interessierenden Verteilung auftreten. Es gelten dann die scharfen Unter- PY (y) 
und Obergrenzen P°(y) für die Wahrscheinlichkeit Q(y)""': 


3.275) R'olsloileätslt-Al 
(3.276) Pr(y)=[o1ln[o(y)+r] 


Diese Grenzen lassen sich damit erklären, dass analog zu dem Worst-Case-Sze- 
nario in Abschnitt 2 bei der Bestimmung der Untergrenze einer Wahrscheinlich- 
keit entsprechend dem Anteil an fehlerhaften Daten A Prozent der kleinsten 
Werte, also ein Anteil in Höhe der Obergrenze des Fehleranteils, durch die 
Obergrenze K,, bei der Bestimmung der Obergrenze entsprechend A Prozent 
der größten Werte durch die Untergrenze K, ersetzt werden. Da Wahrschein- 
lichkeiten auf [0,1] normiert sind, ergeben sich Unter- bzw. Obergrenze der 
Wahrscheinlichkeit schließlich als jeweilige Schnittmenge von [Q(y)-A] bzw. 
[Q(y)+%] mit dem Intervall [0,1]. Der Bereich, in dem sowohl die Untergrenze 
als auch die Obergrenze nicht vom Anteil fehlerbehafteter Daten abhängt, im 
Folgenden in Analogie zu Abschnitt 2 informativer''* Bereich genannt, ist dem- 
nach direkt von A abhängig und — wie sich zeigen wird — bei Korruption und 
Verschmutzung identisch. 


Informative Bereiche allgemein und für die CPS-Daten: 


- Untergrenze allgemein: KE? 
im Fall der CPS-Daten: (0,121, 1] bzw [8,31 , 135] [Tsd. US-Dollar] 


- Obergrenze allgemein: [0 AE OI 
im Fall der CPS-Daten: [0 , 0,879] bzw [0 , 67,39] [Tsd. US-Dollar] 


Ni Vgl. zur Herleitung Horowitz/Manski (1995), Appendix S. 297. 
112 Zum Zusammenhang des informativen Bereiches mit dem Konzept des Bruchpunktes 
siehe Abschnitt 3.3.4. 
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Daraus folgt, dass der vertikale Abstand von der Verteilungsfunktion nach oben 
und nach unten im gemeinsamen informativen Bereich dem Parameter X!” ent- 
spricht. Die Intervallbreite für Wahrscheinlichkeiten beträgt damit im informati- 
ven Bereich allgemein 2-2 und im Fall der CPS-Daten 2-0,121 = 24,2%. 


Auf die CPS-Daten angewendet ergeben sich bei einer Obergrenze von 
A =12,1% für die Fehlerwahrscheinlichkeit p folgende Grenzen. Bei der Be- 
stimmung der Untergrenze der Wahrscheinlichkeit Q(y) werden 12,1 % der 
kleinsten Werte durch K, ersetzt. Q(y) wird um genau diesen Anteil nach unten 
verschoben: Q(y)- 0,121. Bei der Bestimmung der Obergrenze der Wahrschein- 
lichkeit Q(y) werden 12,1 % der größten Werte durch K, ersetzt. Q(y) wird 
dadurch um genau diesen Anteil nach oben verschoben: Q(y)+ 0,121. 


In der Abbildung 3.22 werden die Unter- und Obergrenzen der Vertei- 
lungsfunktion der Haushaltseinkommen der CPS-Daten bei Annahme der 
Rechteckverteilung innerhalb der Klassen dargestellt. 


Unter der Annahme von Verschmutzung, d.h. Fehler treten unabhängig von den 


Stichprobenrealisationen der interessierenden Verteilung auf, gelten die Unter- 


grenzen P (y) und Obergrenzen P9 (y) für Wahrscheinlichkeiten''*: 


(3.277) Prise: 


(3.278) PRC) = [bo [2%] 


Diese Grenzen lassen sich entsprechend der Vorgehensweise bei Korruption so 
erklären, dass bei der Bestimmung der Untergrenze der Wahrscheinlichkeit 
Q(y) A Prozent der Daten gleich K, gesetzt werden - Q(y)- À -, diese A Pro- 
zent nun allerdings nicht durch Ersetzen der A Prozent kleinsten Werte "er- 
gänzt", sondern gleichmäßig — (Q(y)-A)/(L-%) - entzogen werden. Die 
Obergrenze der Wahrscheinlichkeit Q(y) wird entsprechend über Q(y)/(1- A) 
bestimmt. 


113 Auch wenn das Auge dabei getäuscht wird. 
114 Vel. zur Herleitung Horowitz/Manski (1995), S. 288. 
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Abbildung 3.22: Grenzen für die Verteilungsfunktion der jährlichen Haus- 
haltsnettoeinkommen, CPS, Korruption’ 


—— —— Untergrenze bei Korruption = = ———~—- Obergrenze bei Korruption 
identifizierte Verteilung 


Fläche oberhalb der Grenzen der 
Verteilungsfunktion entspricht _ 
der Unter- bzw. Obergrenze, ” 

des Erwartungswertes , 
von Q 


87 


_— 77 
—_ or" 
_— 


T75 


Fläche zwischen der Unter- und 

x Obergrenze der Verteilungsfunktion 
entspricht der Intervallbreite fiir den 
Erwartungswert 


25 
121 
0 
0 831 25 50 75 100 125 
x 
Korruption 


Der informative Bereich bei Verschmutzung entspricht dem bei Korruption, da 
(Q(y)—a)/(1 A entsprechend Q(y)—a bei Korruption fiir Q(y)> A kleiner 


Null und Q(y)/(1—4) entsprechend Q(y)+% bei Korruption für Q(y)>1-A 
größer als 1 wird. 


Die Differenz zwischen der Ober- und Untergrenze fiir Wahrscheinlichkeiten 
beträgt bei Annahme von Verschmutzung und einem Wert von A=12,1% im 


Qly) Oial-A à _ 0.121 _ 


informativen Bereich —— — ——— = —— = —— =]3,765%. 
LA 1-A 1-A 0.879 


Ein Vergleich der Intervallbreiten unter Korruption und Verschmutzung zeigt, 
dass sich das Intervall unter Verschmutzung in der Regel deutlich gegenüber 
dem Intervall bei Korruption verkleinert, in obigem Beispiel hat es sich fast hal- 
biert. 


''S Die Interpretation der Flächen erfolgt in Abschnitt 3.3.2. 
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Abbildung 3.23: Grenzen für die Verteilungsfunktion der jährlichen Haus- 
haltsnettoeinkommen, CPS, Verschmutzung 


—— — Obergrenze bei Verschmutzung — — — — - Untergrenze bei Verschmutzung 
identifizierte Verteilung 


0 25 50 75 100 125 


x 
Verschmutzung 


In Ergänzung zu Horowitz/Manski (1995) lässt sich die Verkleinerung des In- 
tervalls, bzw. der maximale Unterschied zwischen Verschmutzung und Korrup- 
tion exakt angeben. Die Differenz der Intervallbreiten D(A) hängt im informati- 
ven Bereich lediglich von der Obergrenze des Fehleranteils A ab und ist gleich- 
zeitig immer höchstens so groß wie X: 


DA)= [Qy)+a)-(Qly)-a)]- ou) Si 


3.279 Breite bei Korruption l-A i 1-4 
| Breite bei Verschmutzung 
21-2. 
1-4 1-1 


Durch Ableiten von D(A) erhält man die maximale Differenz der Intervall- 


breiten für einen Fehleranteil von A = 1- 0,5- V2 = 29,29 % . Daraus ergibt sich 
eine maximale Differenz der Intervallbreiten im informativen Bereich von 
D(0,2929) = 0,1716, also 17,16 Prozentpunkten. In Abbildung 3.24 ist die Diffe- 
renz der Intervallbreiten in Abhängigkeit von A dargestellt. 
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Bei einem Anteil an fehlerbehafteten Daten von 12,1 % ergibt sich bei den CPS- 
Daten eine maximale Differenz der Intervallbreiten im informativen Bereich von 
D(0,121) = 10,44 %. 


Dies stellt nicht die Obergrenze der Intervalldifferenz dar. Aus den Abbildungen 
3.22 und 3.23 kann man beispielsweise im nichtinformativen Bereich für ein 
Haushaltseinkommen von 0 bei Korruption die Intervallbreite A und bei Ver- 
schmutzung die Intervallbreite 0 ablesen, so dass an dieser Stelle die Differenz 
der Intervallbreiten 12,1 % beträgt und größer als im informativen Bereich ist. 


Abbildung 3.24: Differenz der Intervallbreiten bei Korruption und Verschmut- 
zung im informativen Bereich 


Differenz der Intervallbreiten 


In (3.279) wurde bereits gezeigt, dass die Differenz der Intervallbreiten im in- 
formativen Bereich nie größer als A sein kann. Wie im Folgenden gezeigt wird, 
entspricht die Obergrenze der Fehlerwahrscheinlichkeit A gleichzeitig der maxi- 
mal möglichen Intervalldifferenz zwischen Korruption und Verschmutzung, die 
in Abbildung 3.24 als Winkelhalbierende dargestellt werden könnte. Die 
Winkelhalbierende würde jedoch die Kurve in Abbildung 3.24 zu stark stau- 
chen, so dass sie nicht eingezeichnet wurde. Im nichtinformativen Bereich 
hängen die Intervallbreiten im Unterschied zum informativen Bereich nicht 
allein von A. sondern zusätzlich noch von der identifizierten Verteilung Q ab, so 
dass eine allgemeingültige grafische Darstellung nicht möglich ist. 
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Die Differenz der Intervallbreiten' 16 ist im nichtinformativen Bereich in Abhän- 
gigkeit von A und Q(y) in Übersicht 3.5 angegeben. 


Übersicht 3.5: Differenz der Intervallbreiten im nichtinformativen Bereich 


20,5: 


Q(y)< mat! A.A i L .Q(y) ‚d.h. für Q(y)—> 0 maximal A 


Q(y) = max(1- 1,1) KÉ ‚d.h. für Q(y) > 1 maximal A. 


Dies ergibt sich aus den Bereichen’, in die Q(y) in Abhängigkeit der Ober- 
grenze A fiir die Fehlerwahrscheinlichkeit p eingeteilt werden kann. 


Übersicht 3.6: Bereiche für die Wahrscheinlichkeit Q(y) in Abhängigkeit von A 


Verschmutzung 
= As i u (0.1 und Korruption 
Qly) < min(1-A ; Al = [0, Q(y)/ 1-2] Verschmutzung 
[0,Q(y)+?] Korruption 
Q(y) = max(1-A; x) = (Oly)- Ay Au Verschmutzung 


[Q(y)-A.1] Korruption 


As Qy)sl-A ` a [a)-R/U-R),QWy)/-A)] Verschmutzung 


[Q(y)- A, GE A Korruption 


Dass die Fehlerwahrscheinlichkeit A die maximal mögliche Obergrenze für die 
Differenz der Intervallbreiten darstellt, wird auch anhand der Abbildungen 3.22 
und 3.23 deutlich. Die Intervallbreite für die Wahrscheinlichkeit bei Verschmut- 
zung konvergiert gegen 0, wenn man sich der Unter- bzw. der Obergrenze der 


116 Vel, Horowitz/Manski (1995), S. 289. 
17 Vgl. Horowitz/Manski (1995), S. 287, zu dieser alternativen Darstellung der Bereiche. 
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identifizierten Verteilungsfunktion Q(y) nähert, während die Intervallbreite bei 
Korruption ausgehend von 2-A im informativen Bereich gegen A im nichtinfor- 
mativen Bereich konvergiert. Zudem ist A aber auch der maximal mögliche Ab- 
stand einer Unter- oder Obergrenze von der identifizierten Verteilungsfunktion 
Q(y). In diesem Sinne müssen Horowitz/Manski (1995) verstanden werden, 
wenn sie sagen, dass "P,,(y) and P,(y) can not differ from Q(y) by too 
much".''® Des Weiteren kann mit einer Obergrenze für p allein, also ohne zu- 
sätzliche Informationen, die Hypothese, dass P,(y)= P,,(y) = Q(y) ist, nicht ab- 
gelehnt werden. Dies ergibt sich daraus, dass die Grenzen bei Verschmutzung 
und Korruption allein anhand der identifizierten Verteilungsfunktion Q(y) und 
der Obergrenze A für p ermittelt wurden und Q(y) somit immer innerhalb des 
dadurch bestimmten Bereiches liegt. 


Welche Grenzen fiir Wahrscheinlichkeiten ergeben sich nun fiir die SOEP- 
Daten? In Abschnitt 3.3.2.2 wurde bereits herausgearbeitet, dass bei Verschmut- 
zung keine Grenzen angegeben werden miissen, da die Verteilung der berichte- 
ten Haushaltsnettoeinkommen P, und damit die interessierende Verteilung P 
identifiziert ist, und dass bei Korruption die Verteilung P, als Mischung der 
Verteilungen Q und P,, 


(3.274) P =(1-p) Q+p: Po. 


resultiert. Dies bedeutet, dass bei der Bestimmung der Grenzen für Wahrschein- 
lichkeiten die identifizierte Verteilung Q mit (1 - Al entsprechend dem Fehler- 


anteil heruntergewichtet wird und für die identifizierte aber latente Verteilung 
Da bei der Bestimmung 


- der Untergrenze A Prozent Werte in Höhe der Obergrenze K, 
- der Obergrenze A Prozent Werte in Höhe der Untergrenze Ko 


hinzugefügt werden. Die Intervallbreite entspricht somit im gesamten, nicht nur 
im informativen Bereich der Obergrenze A der Fehlerwahrscheinlichkeit p. 


18 Vgl, Horowitz/Manski (1995), S. 287. 
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Dies entspricht den Grenzen für Wahrscheinlichkeiten — dort mit P(yeB) be- 
zeichnet —, die beispielsweise in Manski (1995) in Zusammenhang mit dem Se- 
lektionsproblem dargestellt wurden "D? 


P(ye Biz = 1)- pt =1) 
(3.280) <P(yeB 
< Ply € Biz =1)- P(z = 1)+ P(z =0) 


Somit ergeben sich als Sonderfall bei Korruption die gleichen Grenzen fiir 
Wahrscheinlichkeiten wie unter Berticksichtigung des Selektionsproblems, falls, 
in der Darstellung von Horowitz/Manski (1995), die Verteilung P,, identifiziert 
werden kann. Diese Grenzen fiir die Verteilungsfunktion der Haushaltsnettoein- 
kommen sind in Abbildung 3.25 dargestellt. 


Abbildung 3.25: Grenzen fiir die Verteilungsfunktion der Haushaltsnettoein- 
kommen, 


SOEP, Korruption 


—— —— Obergrenze Verteilungsfunktion — ———- Untergrenze Verteilungsfunktion 
identifizierte Verteilung 


1? Vgl. auch Manski (1995), S.25. 
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3.3.3.2 Identifikation von D-Parametern 


Mit Hilfe der im letzten Abschnitt ermittelten Unter- und Obergrenzen fir die 
Verteilungsfunktion könnte man jetzt beispielsweise Unter- und Obergrenzen 
fiir Quantile bzw. die Quantilfunktion einfach durch Inversion dieser Unter- und 
Obergrenzen bestimmen. Aus der Inversion der Untergrenze (Obergrenze) der 
Verteilungsfunktion wiirde man dann die Obergrenze (Untergrenze) der Quantil- 
funktion erhalten. Entsprechende Inversion ist allerdings bei der Bestimmung 
von Grenzen für den Erwartungswert nicht möglich. Horowitz/Manski definie- 
ren deshalb, um ganz allgemein Grenzen für D-Parameter angeben zu können, 
zwei Verteilungsfunktionen'”, L, und U,, in Abhängigkeit einer Obergrenze 


A für die Fehlerwahrscheinlichkeit p: 


L, [-%,t]= ka e, t|/(1-A) für t < d 2 ` 


1 für t 2> r(1—À 
(3.281) 


U,[-%,t]= Kabel. t]-à)/(1- oe N 


Bei Verschmutzung erhält man die scharfen Grenzen der D-Parameter t(.) di- 
rekt aus den Verteilungen L, und U, 


(3.282) (P )e[x(L, Le, 


während bei Korruption die Untergrenze K, und die Obergrenze K, die Inter- 
vallbreite explizit beeinflussen 


(3.283) (P)elt{l-A)-L, +A-K,}, (1-4): U, +4-K, }]. 


Damit lassen sich die scharfen Grenzen fiir den Erwartungswert bei Verschmut- 
zung (3.284) und bei Korruption (3.285) ermitteln." 


120 Vgl. Horowitz/Manski (1995), S. 289, zu einer alternativen Bestimmung von Quantilen. 

1?! Oder — wie in der Abbildung 3.22 eingezeichnet — als Fläche oberhalb der Grenzen der 
Verteilungsfunktion, bzw. die Intervallbreite als Fläche zwischen den Grenzen der 
Verteilungsfunktion. 
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t=r(1-%) 


(3.284) d [yaL, , hau, 
-0 t=r(A) 


t=r(1-A) oi 
(3.285) dE [ydL, 3 Ka, (I-A): [ydU, +2-K, 


-0 t=r(à) 


Durch die Bestimmung der Grenzen des Erwartungswertes bei Verschmutzung 
in (3.283) erkennt man direkt, dass aus der Existenz des Erwartungswertes der 


identifizierten Verteilung Q mit JydQ > —00 [yaL, >-co und aus f ydQ <a 
fydu, <œ folgt, dass die Grenzen des Erwartungswertes endlich sind. Bei 


Verschmutzung können somit im Gegensatz zu den robusten Verfahren endliche 
Grenzen für den Erwartungswert angegeben werden. Bei den robusten Verfah- 
ren wird die noch unbekannte, nicht realisierte Verteilung Q als Teilmenge 


(3.286) Qe{(l-p)- Pi +p- y:yEY, psi} 


aller möglichen Verteilungen angesehen, die von der Menge der Verteilungen 
Y abhängt, über die weder bei Verschmutzung noch bei Korruption a-priori- 
Informationen vorliegen. Ohne solche a-priori-Informationen ist die Menge der 
Verteilungen YY und somit auch der Erwartungswert der unbekannten, noch 
nicht realisierten Verteilung Q nicht beschränkbar. 


Die Grenzen für Quantile ergeben sich dann bei Verschmutzung (3.287) und bei 
Korruption (3.288) aus der entsprechenden Inversion der definierten Vertei- 
lungsfunktionen L, und U, : 


(3.287) qy(a)e[rfal-A)p ral- 
(3.288) q,(a)e[r(a- à) r(a+A)] 


Für die CPS-Daten des U.S. Bureau und die SOEP-Daten des Deutschen Insti- 
tuts für Wirtschaftsforschung ergeben sich damit die in Tabelle 3.27 zusammen- 
gefassten Kenngrößen und Intervalle. Die Abbildungen 3.26-3.28 zeigen die 
Quantilfunktionen bei Verschmutzung und Korruption für die CPS- und bei 
Korruption für die SOEP-Daten. 
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Abbildung 3.26: Grenzen für Quantile des jährlichen Haushaltsnettoeinkom- 
mens bei Verschmutzung, CPS 


—---- Untergrenze Verschmutzung —— — Obergrenze Verschmutzung 
identifizierte Verteilung 


.5 
F(x) 


Abbildung 3.27: Grenzen für Quantile des jährlichen Haushaltsnettoeinkom- 


men bei Korruption, CPS 


----- Obergrenze Korruption —— —— Untergrenze Korruption 
identifizierte Verteilung 
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Tabelle 3.27: Kenngrößen und Intervalle, Haushaltsnettoeinkommen 


Verschmutzung | Korruption |Verschmutzung | Korruption 


Erwartungs- 35,495 4,160 (3,961) 
(1) 
ve as Set 
CO 
Median” 


3,822 (3,600) 


[25,45 ; 33] Ers 96 ; 37,27] i 713;3 = 


10%- 
Quanti 


1% 1,756 (1,800) 


[6,7 ; on) [0 ; 13,35] [1,389 ; 1,797] 


25%- 


Quantil® > 2,615 (2,500) 
13,29;19,77] | [8,69 ; 21,5] l [2,441 ; 2,674] 


%- 
75% 5,016 (5,000) 


Quanti]? 
[40.19 ; 51,77] | [37,88 ; 65,65] [4,952 ; 5 = 


ei [em 0 bert 
90%- 


[53,04 ; mae? [51,63 ; 135] me ; 7,861] 


(in runden Klammern stehen die aus dem SOEP-Datensatz ermittelten Kenngrößen, Ein- 
kommen jeweils in 1000 $ bzw. 1000 DM angegeben) 

0: 1. Zeile: Erwartungswert, 2. Zeile: Grenzen für den Erwartungswert ®: 1. Zeile: Grenzen 
für die Wahrscheinlichkeit, 2. Zeile: Quantil, 3. Zeile: Grenzen für das Quantil 
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Abbildung 3.28: Grenzen der Quantile des Haushaltsnettoeinkommens bei 
Korruption, SOEP 


EE Obergrenze Korruption —— — Untergrenze Korruption 
identifizierte Verteilung 


20 


15 


10 


oa ao 


3.3.4 Identifikationsanalyse im Vergleich mit robusten Verfahren 


Man kann sich nun fragen, warum man — von dem Problem der Beschränkbar- 
keit des Erartungswertes einmal abgesehen — auf die Punktschätzung von D-Pa- 
rametern mit Hilfe robuster Verfahren verzichten und stattdessen versuchen soll, 
mit Hilfe der Identifikationsanalyse lediglich Punktschätzungen für Grenzen der 
D-Parameter anzugeben. Zudem ist es bislang nicht möglich, Varianzformeln 
für diese Punktschätzungen der Grenzen anzugeben. In Abschnitt 3.3.5 werden 
in Anlehnung an Manski/Pepper (2000) unter Verwendung des Bootstrap-Ver- 
fahrens Konfidenzintervalle angegeben. 


Bevor das Hauptargument von Horowitz/Manski (1995) dargelegt wird, soll ein 
kurzer systematischer Vergleich der prinzipiellen Vorgehensweisen der Identifi- 
kationsanalyse und der robusten Verfahren erfolgen. 


Ausgangspunkt ist die allgemeine Darstellung des Identifikationsproblems bei 
Verschmutzung und Korruption in Abschnitt 3.3.1.2 durch die Beziehungen 
(3.269) und (3.270). 
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Übersicht 3.7: Vergleich der Identifikationsanalyse mit robusten Verfahren 
(3.269) P, =(1- p): P,ı +p: Pio 
(3.270) Q = (1- p): Pi; +p- Poo 


Identifikationsanalyse Robuste Verfahren 


Q ist identifiziert Q ist unbekannt 


1(P, ) ist unbekannt 1(Q) wird konsistent geschätzt 


Ex-post Ermittlung von scharfen Ex-ante Begrenzung von 7(Q)- (P1) 
Grenzen für dp 1 durch Variation von | durch Variation von Q in den durch 
P, in den durch (3.269) und (3.270) begrenzte Einflussfunktionen 
gesetzten Grenzen. gesetzten Grenzen. 
Grenzen für dp ) sind identifiziert. 


l dp ) kann nicht identifiziert werden, 
Differenz der Ober- und Untergrenze 


. somit ist |t(Q)- (P, ) ohne Schätzun 
stellt eine Art "Gross Errror | Q) ( d E 5 
Sensitive dar 2 von A nicht identifizierbar 


Fokus auf ex-post Inferenz Fokus auf ex-ante Inferenz 


Als weiteren Nachteil der Identifikationsanalyse könnte man ansehen, dass bei 
der konsistenten Schätzung von (Q) eine Schätzung der Obergrenze für die 
Fehlerwahrscheinlichkeit p nicht nötig ist, die Identifikationsanalyse also auch 
noch eine zusätzliche Größe voraussetzt. Dagegen ist aber einzuwenden, dass 
ohne eine solche Obergrenze die asymptotische Verzerrung |t{(Q)-{P,] des kon- 


sistenten Schätzers weder angegeben werden noch eine Garantie dafür gegeben 
werden kann, dass dieser Fehler endlich ist. Horowitz/Manski (1995) ziehen 
daraus das Fazit: 


"The usefulness of a point estimator with unknown and, possibly, 
unbounded asymptotic bias is not obvious. Moreover, given an upper 
bound on p, estimation of 1(Q) yields no information on dp 
beyond that contained in our tight bounds"! 


Als weiteren Vorteil fiir die Identifikationsanalyse nennen Horowitz/Manski 
(1995)!?*, dass: 


2 Vgl. Horowitz/Manski (1995), S. 294. 
123 ` Horowitz/Manski (1995), S. 283. 
124 Horowitz/Manski (1995), S. 283. 
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".. some outcomes that are possible ex ante can be ruled out ex post, 
after the data have been collected. Identification analysis characterizes 
the inference that can be made given the knowledge of the empirical 
distribution of the data." 


Sie schlieBen daraus, dass in diesem Sinne die prinzipielle Vorgehensweise der 
robusten Verfahren in vielen Fällen konservativer als nötig ist. 


3.3.5 Bootstrap-Konfidenzintervalle 


Wie in Abschnitt 3.3.4 schon angedeutet, wurden bislang keine Varianzschätzer 
für die Unter- und Obergrenzen von D-Parametern entwickelt und nur indirekt 
in einer Anwendung bei Manski/Pepper (2000) Bootstrap-Schätzer für einen 
ähnlichen Zweck verwendet. Deshalb wurden im Folgenden, um erste Eindrücke 
über die Streuung der Grenzen zu erhalten, Bootstrap-Konfidenzintervalle für 
die Grenzen der Quantilfunktionen der verwendeten CPS- und SOEP-Daten be- 
stimmt. Es wurden jeweils 1000 Stichproben mit Zurücklegen gezogen und aus 
diesen Stichproben ein symmetrisches 95 %-Intervall ermittelt. Die Abbildun- 
gen 3.29 und 3.30 zeigen, dass die Konfidenzintervalle der Unter- und der 
Obergrenze im Verhältnis zu der Intervallbreite Obergrenze-Untergrenze sowohl 
bei Verschmutzung als auch bei Korruption fast vernachlässigbar gering ausfal- 
len. Dabei wurden die Konfidenzintervalle der Unter- und Obergrenze für das 
10%-, 20%-, 25%-, 30%-, 40%-, 50%-, 60%-, 70%-, 75%-, 80%- und 90%- 
Quantil berechnet. Tabelle 3.28 fasst die Ergebnisse zusammen. 


(1) 


Tabelle 3.28: Kenngrößen der Bootstrap-Konfidenzintervalle 


Durchschnittliche 


Durch- 


Konfidenz- BE See H Minimale Maximale Differenz 
intervall .._ | Intervallbreite | Intervallbreite| Obergrenze- 

Intervallbreite 
Untergrenze 


Untergrenze 11.28308 
Verschmutzung 1,47386 1,10508 1,92514 
Obergrenze 


Korruption 1,24237 0.60004 1,66513 
Untergrenze 
Korruption 1.56602 1,06007 2,30516 
Obergrenze 


“Angaben in 1000 $ bzw. 1000 DM 


26,38032 
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Abbildung 3.29: Konfidenzintervalle der Ober- und Untergrenzen der Quantil- 
funktion des Haushaltsnettoeinkommens bei Verschmutzung, 
CPS 


.5 
F(x) 


Abbildung 3.30: Konfidenzintervalle der Ober- und Untergrenzen der Quantil- 
funktion des Haushaltsnettoeinkommens bei Korruption, CPS 
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Dieses Ergebnis bestätigt sich erwartungsgemäß für den SOEP-Datensatz, da die 
Verschmutzung dort mit 4,43 % nur knapp 1/3 der Verschmutzung des CPS- 
Datensatzes ausmacht. Auf eine zahlenmäßige Darstellung der Grenzen wird 
angesichts der minimalen Intervallbreiten (im einstelligen DM-Bereich) ver- 
zichtet. 


Abbildung 3.31: Konfidenzintervalle der Ober- und Untergrenzen der Quantil- 
funktion des Haushaltsnettoeinkommens bei Korruption, 
SOEP 


3.3.6 Identifikation von D-Treatmenteffekten 


Die Konsequenzen, die sich bei der Berücksichtigung von Datenfehlern zur 
Schätzung von Grenzen für D-Treatmenteffekte ergeben, sollen mit Hilfe der 
SOEP-Daten'” am Fall des Worst-Case-Szenarios aus Abschnitt 3.2.2 de- 
monstriert werden. Wie schon in Abschnitt 3.3.3.1 erhält man — auf anderem 
Weg - Resultate aus der Analyse zensierter Stichproben. 


13 Die CPS-Daten können hier nicht verwendet werden, da die zur Schätzung von D- 
Treatmenteffekten nötigen Informationen über eine Treatmentvariable nicht gegeben sind. 
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Ohne Beriicksichtigung der Antwortverweigerer gelten die scharfen Grenzen fiir 
den Erwartungswert aus Abschnitt 2.2 


Ku: Plz # tlw) + Elylw,z = t): P(z = tlw) 
< E OD ; 
< K, Plz = t|w)+ E(yjw,z = t): P(z = tlw) 


(3.289) 


Berücksichtigt man nun, dass 4,43 % der in der Stichprobe befindlichen Haus- 
halte aufgrund Antwortverweigerung keine Angaben zum Haushaltseinkommen 
gemacht haben, werden bei der Bestimmung der Untergrenze (Obergrenze) des 
Erwartungswertes die A Prozent fehlenden Daten mit K, (K,) zu dem Anteil 


der Personen mit z +t hinzugenommen und analog zu Abschnitt 3.3.1 die An- 
teile der Personen mit z =t und z +t entsprechend dem Anteil an fehlerhaften 
Daten A gewichtet. 


K, -[P(z # t|w)-(1-A)+4]+ Elylw,z = t)-[P(z = tw)-(1-%)] 
< E y(t)w 
<K, Jet: # tw). (1 oe E(y W,Z= t)- [P(z = do LO ~A)] 


Daraus folgt fiir die Unter- und Obergrenze des durchschnittlichen Treatmentef- 
fekts, die sich dann wie in Abschnitt 3.2.2 als Differenz der Untergrenze des 
Erwartungswertes bei t, und der Obergrenze bei t, bzw. der Differenz zwischen 


der Obergrenze des Erwartungswertes bei t, und der Untergrenze bei t, erge- 
ben: 
E(ylw,z = t} [P(z = Gel (1 ~A)]+ Ky Jet z Gel (1-%)+ A 
- E(y|w,z =t Hlp = t,|w)-(1-2)]-K, Is #t,|w)-(1-a)+a] 


(3.291) < Ely(t, Jw]- Ely(t, }w]< 


W,Z= t,)- [P(z = Gel (1-2)]+ K, [P(z # Gel (1 SANEA] 
w,z=t,)-[P(z=t,|w)-(1-4)]-K, - [P(z # t,|w)-(1-4)+ 3 


Ely 
-E(y 


Der maximale Unterschied zwischen Ober- und Untergrenze des ATE beträgt 
dann 


(3.292)  (K,-K,)-|(1-A)-{ P(z¥t,|w)+ P(z#t,|w)}4+2-a] , 
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und ist im Vergleich zu dem maximalen Unterschied aus Abschnitt 3.2.2, ohne 
Berücksichtigung von Fehlern um den Ausdruck in (3.294) größer geworden. 


(3.293) (K,-K,): [P(z + ty|w)+ P(z + Gel 
(3.294) I,-Kallü-ALlbizstwlPlzstlelz3Al 


Absolute Obergrenze des Unterschieds bleibt wie in Abschnitt 3.2.2 
2-(K,-K,). Während diese Obergrenze nur für den Fall, dass 


P(z #t,|w)+ P(z#t,jw)=2, d.h. für P(z=t,|w), P(z =t,|w)— 0 erreicht wer- 
den konnte, ergibt sich diese Obergrenze nun offensichtlich auch ftir einen Feh- 


leranteil von 100 Prozent, 4 =1. Für einen fehlerfreien Datensatz, mit A =0, 
erhält man als Spezialfall wieder den maximalen Unterschied in (3.293). 


Es bleibt abschließend anzumerken, dass es im Rahmen der bisher entwickelten 
Identifikationsanalyse, ohne weitere Annahmen zu treffen, bei der Bestimmung 
von Grenzen für D-Parameter keine Rolle spielt, ob für die 4,43 % Antwortver- 
weigerer Informationen über die Treatmentvariable vorhanden sind oder nicht. 
Zerlegt man den Anteil der Antwortverweigerer X in einen Anteil an Antwort- 
verweigerer, die den Wert t realisiert haben (%,_,), und den Anteil derjenigen, 
die nicht t realisiert haben (1,,,), so gilt wegen À =À,- +A 
für die Untergrenze 


swt beispielsweise 


K, [Plz # t)-(1-A)+A]+ [E(ylz =t)- P(z = t)-(1-a)] 
(3.295) =K,-[P(z#t)-(1-A)+ (Ager + Aver I+ [E(yiz =t) P(z = ED AN 
= Ky [P(e #t)- -A)r l+ [Elle =1): Pe =t)-(1-2)+ eK] 


Die Beriicksichtigung von Datenfehlern erfolgt fiir die anderen Annahmen aus 
Abschnitt 3.2 auf entsprechende Art und Weise und wird deshalb hier nicht 
weiter dargestellt. 
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3.4 Nichtparametrische Schätzung der Lohndiskriminierung 
3.4.1 Problemstellung 


Ein weit verbreiteter Ansatz zur Analyse des Lohnunterschiedes zwischen zwei 
Gruppen geht auf die Arbeiten von Oaxaca und Blinder in den 70er Jahren zu- 
riick. Sie schlugen vor fiir beide Gruppen, im Folgenden beispielhaft Manner 
(m) und Frauen (w), separate Lohnfunktionen (1) und (2) zu schätzen und dabei 
die Eigenschaft der OLS-Regression zu verwenden, dass die Regressionsgerade 
durch den Schwerpunkt geht: 


(1) Xm 
Xy 


(2) 


Xm =Bo +B; 5. 
Xw =Bo +Pı 5, 


Zieht man nun die zweite Gleichung von der ersten ab und ergänzt in (a) Null in 
Form von +ß}' -5,,, der durchschnittlichen Ausbildung der Frauen, $, , bewertet 


mit der Ertragsrate der Männer, BT. und in (b) in Form von +8," -S,,, der durch- 
schnittlichen Ausbildung der Männer, 5, bewertet mit der Ertragsrate der 


Frauen, D, so erhält man zwei verschiedene Varianten (a) und (b), mit denen 
man die Differenz der Durchschnittlöhne zerlegen kann:'*° 


(a) Xi hy = (pr ps, Je: -pr )+ BF (n - 5) 
N bereed 
Diskriminierung Ausstattungs- 
unterschiede 


(b) Xin Rn = (pr OAI (p7 zpr lep (Sn SEIN 


Diskriminierung Ausstattungs- 
unterschiede 


Das Prinzip dieser beiden Zerlegungen besteht darin, die Differenz zwischen 
den durchschnittlichen Löhnen der Männer (X,,) und den durchschnittlichen 


Löhnen der Frauen (X, ) in einen Teil zu zerlegen, der die Differenz der durch- 
schnittlichen Ausbildungsunterschiede (5, -5,), und einen anderen Teil, der 
die Differenz der Bildungsertragsraten (pr = Br) beinhaltet. Letzterer wird übli- 
cherweise als Diskriminierung auf dem Arbeitsmarkt interpretiert. 


126 Siehe Kapitel 4 zu alternativen Zerlegungen. 
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Diese beiden Teile werden je nach Nullergänzung - siehe (a) und (b) — entweder 
mit den entsprechenden geschätzten Parametern, durchschnittliche Ausbildung 
bzw. Bildungsertragsrate, der Manner oder der Frauen gewichtet.'”’ 


Im Folgenden soll nun versucht werden, diese Analyse auf der Grundlage der 
nichtparametrischen Schätzung von Erwartungswerten und Bildungsertragsraten 
der bisher vorgestellten Annahmen durchzufiihren. Wie sich zeigen wird, erge- 
ben sich sowohl sehr ähnliche Darstellungsformen als auch prinzipielle Unter- 
schiede. Beispielsweise entfallt das Problem der Wahl der Referenzstruktur. 


3.4.2 Messung der Diskriminierung auf der Basis exogener 
Treatmentselektion (ETS) 


Mit der Annahme von ETS aus Abschnitt 3.1.3.1 ergab sich als Bildungsertrags- 
rate der i-ten Gruppe bezogen auf t, bzw. t, Jahre Schulbildung, nun in Analo- 


gie zu den Regressionsmodellen mit ß bezeichnet: 

(3.296) BR. =E ERS. 

Umgeschrieben erhält man den Erwartungswert der i-ten Gruppe bei t, Jahren 
Schulbildung als 

G29 ge ef 


Li t;,t 


Verwendet man nun als Gruppen wieder Männer (m) und Frauen (w), kann die 
Differenz des Erwartungswertes der Löhne von Männern und der Frauen bei t, 


Jahren Schulbildung mit Hilfe eines beliebigen Basiswertes von t, Jahren 
Schulbildung und der zugehörigen Bildungsertragsrate Bi, dargestellt werden 
als: 


(3.298) BETS _ BETS _ (BETS _ EETS), (pmETS _gmETs) | 
Ny eee 


w,t2 tı,ta Dia 


(1) (2) 


127 siehe auch Kapitel 4 zum Problem der Wahl der Zerlegung. 
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Die Teile (1) und (2) auf der rechten Seite lassen sich entsprechend dem Ansatz 
von Oaxaca/Blinder interpretieren. Teil (1) hängt nicht von den Bildungsertrags- 
raten der Männer bzw. Frauen in Bezug auf t, und t, Jahre Schulbildung ab 


und lässt sich damit entsprechend der Differenz der Absolutglieder interpretie- 
ren: 


(3.299) (BETS — BETS Ja (gm -pY ) . 


Teil (2) in (3.298) lässt sich nun analog zur Differenz der Bildungsertragsraten, 
die auch als Preise auf dem Arbeitsmarkt interpretiert werden, beim 
Oaxaca/Blinder-Ansatz deuten: 


(3.300) (BRES —py ETS) = (pm pr). 


Der Term der Ausstattungsunterschiede in (a) und (b), D IS, -5,), fällt nun 


ganz im Sinne der Betrachtung von Treatmenteffekten weg, da hier die Aus- 
stattungsunterschiede (S„ -5„) dadurch beseitigt werden, dass überlegt wird, 


was der Durchschnittslohn der i-ten Gruppe wäre, wenn alle Personen der i-ten 
Gruppe dieselbe Anzahl an Schuljahren aufweisen würden. Insoweit beruht die 
hier betrachtete Zerlegung auf der Grundlage der Annahme von ETS auf einer 
alternativen Bereinigung der Ausstattungsunterschiede, die dazu führt, dass die 
gesamte Differenz der Erwartungswerte zwischen Männern und Frauen bei t, 


Bildungsjahren als Diskriminierung interpretiert werden muss. Die Differenz 
zwischen den Erwartungswerten bei t, Bildungsjahren lässt sich im Fall der 


Annahme von ETS dann zu einer beliebigen Basis von t, Bildungsjahren, 
t, <t,, schreiben als (3.301). 


Demnach ergibt sich die Diskriminierung bei t, Bildungsjahren durch Kumulie- 
rung aller Preisdifferenzen, beginnend bei t, Bildungsjahren, wobei 
pae sp) positiv oder negativ sein kann, je nachdem ob Männer oder 
Frauen höhere entsprechende Bildungsertragsraten aufweisen. 


Da die Ausstattungsunterschiede durch die Annahme von ETS quasi eliminiert 
wurden, kann in (a) bzw. (b) S, = 5„ gesetzt werden und die Preisunterschiede 


(pr = Br) miissen nicht gewichtet werden. 
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(a') Em -Xy =(B" Ba, -(B"-B”)+B"-G,, -3,)= (BR pls br pl 
(eis, -Xe = BT -pY )+5,, BT -BY )HBY Ga -5, )=(B" -BY )+5-(B? -B") 


ETS ETS _ (nETS ETS m,ETS ` qw,ETS 
En str Be ta (EE! to By Dh Da ge 
u (E ETS an D (pm#7s — pWETS ) 
ze m sti w ty tz -I,t2 t,-Ltz 
Mn (pm „ETS p” ETS ) 
eo Gem Be, -2,t-1 
(3.301) En 


+ (Br ‚ETS p” ETS ) 
ty Di ` D. t, +1 


| 
ETS ETS m,ETS w,ETS 
= (BF tr BS sti )+ Kä da = Bera ) 


r=t, 


Die Verwendung der beiden Referenzgruppen führt nun logischerweise zu der 
gleichen Zerlegung. Der einzige Unterschied, der dann noch im Vergleich zu 
(3.298) übrig bleibt, besteht in dem Faktor S = 8. = Sẹ, der als Normierungsfak- 


tor interpretiert werden kann. 


Auch die nichtparametrische Zerlegung auf der Grundlage von ETS kann umge- 
schrieben werden, um einen solchen Normierungsfaktor zu erhalten. Berechnet 


man, jeweils für Männer und Frauen, die durchschnittliche jährliche Bildungs- 


1,ETS 
Bet SODES 
ertragsrate Bin, ETS als PBe > = — 2 und verwendet diese in der Zerlegung, so 


t-t 
erhält man: 


(3.302) pais Er ‚ETS = (EM „ETS e (t, t ,)- (Br ETS _ Bn R, 


DE t),t2 


Im Gegensatz zu der traditionellen Zerlegung erhält man hier je nach Wahl von 
t, und t, einen anderen Wert für die Normierung. Setzt man jedoch wie bei der 


Annahme von CMTR t; = 0, ergibt sich nochmals eine Vereinfachung 
(3.303) GE EY ‚ETS = (Er ETS - EY on t,- Tras SSC, 
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so dass dann t, als 5 und der erste Ausdruck entsprechend der Differenz der 
Absolutglieder einer Regression gedeutet werden kann. 


Das Problem der Wahl der Referenzgruppe gemäß der Zerlegung nach 
Oaxaca/Blinder besteht somit nicht mehr. Dadurch, dass zur Messung der Dis- 
kriminierung nun jedoch immer die Basisgröße (Ets — SC variiert wer- 
den kann bzw. nicht exogen vorgegeben ist, besteht allerdings insofern ein 
Wahlproblem, als bei n verschiedenen Bildungsjahren n-(n—1)/2 verschiedene 
Zerlegungen untersucht werden können und man sich aus Praktikabilitätsgrün- 
den auf die jeweils wichtigsten beschränken muss. 


3.4.3 Messung der Diskriminierung auf der Basis alternativer Annahmen 


Bei der Verwendung der Annahmen aus den Abschnitten 3.2-3.6 zur nichtpara- 
metrischen Messung der Diskriminierung, ergeben sich keine prinzipiellen Un- 
terschiede gegenüber der Zerlegung auf der Basis der Annahme von ETS. Es 
muss lediglich bei der Darstellung beachtet werden, dass Ober- und Untergren- 
zen von Erwartungswerten bzw. Bildungsertragsraten verwendet werden. 


Die Obergrenze (O) der Bildungsertragsrate der i-ten Gruppe bei Annahme V 
ergibt sich als Differenz der Obergrenze des Erwartungswertes der i-ten Gruppe 
bei t, Bildungsjahren und der Untergrenze (U) des Erwartungswertes bei t, Bil- 
dungsjahren: 
(3.304) Bi) = EY - Ee . 
Damit ergibt die Differenz der Obergrenzen der Bildungsertragsraten der beiden 
Gruppen 

m,O,V _ aw,0,V _ {p0,V ON U,V _ GUN 
(3.305) Es =D... = Jeu Eyit E (BUY 7 BUY) ’ 
und die Differenz der Obergrenzen der Erwartungswerte beider Gruppen bei t, 
Bildungsjahren kann geschrieben werden als: 


(3.306) RE _EOYV = D 8 POY) (prey = prov) 


w,t2 m,t, WD ty ,to ty te 
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Auch hier ergeben sich weitere Darstellungsformen durch Variation der ,,Basis- 


größe“ (ELY _ Ey j Diese kann beispielsweise ersetzt werden durch: 


(3.307) (peu u pruy). DM _ BUY = (Eo _ FOV ) l 


to,t, tosti (Bd WD m,to w,to 


um zu einer Darstellung bezüglich einer Basisdifferenz der Obergrenzen zu ge- 
langen: 


(3.308) GEN EEN as IO _ FOV L (peu a peu jy (prov B Bro) l 


wt m,to w,tg tosti Io, Do t,,t2 


Bei der Interpretation der Differenz pay = prev) auf der rechten Seite muss 


beachtet werden, dass es sich bei den beiden Größen nur dann um Untergrenzen 
der Bildungsertragsraten handelt, wenn der jeweilige Wert der durch die An- 
nahme V vorgegebenen Untergrenze nicht widerspricht. 


Allgemein lässt sich dann die Differenz der Obergrenzen der Erwartungswerte 
zur Basis t, formulieren: 


OMTR _pOMTR _ (ESY on) 
m,ty +2-w w,t,t+2-w — \"m,t w,ty 
w U,V,m _ QU,V,w ) 
(3.309) It +2-i,ty DEA ty +2-1,t, +2-1+1 


T Lal (pov BC 
i=0 ty t2-i4+],ty +2-1+2 t„+2-i+l,t, +2-1+2 


Auch eine Darstellung ohne Differenz der Untergrenzen der Bildungsertragsra- 
ten ist durch entsprechende Nullergänzung von 


ee _pw.o.v ) 
— tustu +i tat, +i 


u? u Hau 


auf der rechten Seite der allgemeinen Form von (3.292) möglich: 
(3.310) ESY -EOY = (BUY — BUY )4 (pmo prä 


O,V ON _ U,V U,V m,O,V _ aw,0,V 
Ents u Eur, u [EIN 7 Eur, )+ tusturı tustu] ) 


t,-t 
(3.311) H 5 (prov ` aw,0,V Leg 8 woy) ' 
tustu tit tustu +i+l tusta ti Kee 
i=l 
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Neben der Messung der Diskriminierung, die sich bei der Betrachtung der Diffe- 
renz der Obergrenzen bei t Bildungsjahren von Männern und Frauen ergibt, 
kann eine Punktschätzung der minimalen bzw. eine maximalen Diskriminierung 
ermittelt werden. 


Die Punktschätzung der minimalen Diskriminierung von Frauen erhält man, 
wenn anstelle der Differenz der Obergrenzen, die Differenz der Untergrenze der 
Männer und der Obergrenze der Frauen betrachtet wird: 


ty ‚to ty sto 


(3.312) EUX -E9 = (Ey, -EUY sz 


maximale minimale 
Basisdifferenz zusätzliche 
Preisdifferenz 


Entsprechend erhält man die Punktschätzung der Obergrenze der Diskriminie- 
rung bei der Ermittlung der Differenz der Obergrenze der Männer und der Un- 
tergrenze der Frauen: 


tu sto ta sto 


Dam BOY -EUY = (Eu -EOX ) (moy pru) 
i 


minimale maximale 
Basisdifferenz zusätzliche 
Preisdifferenz 


Die Obergrenze (Untergrenze) der Diskriminierung erhält man demnach da- 
durch, dass die Basisdifferenz minimiert (maximiert) wird, damit die zusätzliche 
Preisdifferenz maximiert (minimiert) wird. 


Auch für diese beiden Fälle erhält man eine Darstellung bezüglich tmin 


(3.314) BUY -EOY = (OY _ BUY), gmuv gail, 


tu sto tusto 


(3.315) BOY -EYY = (BUY _ BOY )+ (rOy _ pw tv) 


tusto u>'o 
und durch entsprechende Nullergänzung eine entsprechende Darstellung 


U,V ON _ ON U,V m,U,V w,0,V 
ee = Eur, " ei? Beie )+ u P ) 


tu sust tu Cust 


t„-t 
(3.316) $ Ka IM _ aw,0,V )- prey — BOY) > 
tustu +i+l tustu +i+l tustu +i tustu ti 
i=] 
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ON _ UV _ [RUV GON m,0,V _ qw,U,V 
Ent, ~ Eur, = (BUY Bat )+ E ) 


ty ua ty tus 


to-t 
(3.317) a KS ch ` on UlN )- (pro = a) 
tustu titl ty ty +i+1 tustu +i tustu +i 
i=l 


Die nichtparametrische Messung der Lohndiskriminierung in Analogie zur 
Oaxaca/Blinder-Zerlegung weist sowohl Parallelen als auch Unterschiede auf. 
Da bei der nichtparametrischen Messung nicht versucht wird, durchschnittliche 
Preise und durchschnittliche Ausstattungen zu verwenden, entfallt das Refe- 
renzgruppenproblem des Oaxaca/Blinder-Ansatzes. Dies wird allerdings da- 
durch bezahlt, dass man anstelle der Referenzgruppe eine Basisausstattung, d.h. 
ein Basisbildungsjahr wählen muss und hier entsprechend der jeweils verwen- 
deten Umrechnung in Bildungsjahre und in Analogie zu der Bestimmung nicht- 
parametrischer Obergrenzen des Abschnittes 3.2 viele Möglichkeiten zur Aus- 
wahl hat. Dies erlaubt jedoch andererseits wieder eine detailliertere Betrachtung 
der Diskriminierungsstruktur. Es bleibt abzuwarten, welche zusätzlichen Infor- 
mationen hieraus in der jeweiligen Anwendung gewonnen werden können. 
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Teil II: Empirische Analyse der Entwicklung der Bildungsrenditen in 
Deutschland 


In Teil I der Arbeit wurden in Kapitel 2 die wichtigsten traditionellen Schätzver- 
fahren zur Bestimmung von Bildungsertragsraten dargestellt und kritisch ge- 
würdigt. Auf der Grundlage dieser Kritik wurden dann in Kapitel 3 alternative 
nichtparametrische Grenzen und Intervalle für Treatmenteffekte, Erwartungs- 
werte und Quantile entwickelt. Dabei wurden, ausgehend vom jeweils schlech- 
test möglichen Intervall, plausible Annahmen eingeführt, mit denen Schritt für 
Schritt das Intervall möglicher Punktschätzungen verengt werden kann. In Teil 
II der Arbeit sollen nun diese nichtparametrischen Ansätze auf Fragestellungen 
im Rahmen der Humankapitaltheorie und dabei insbesondere auf die Schätzung 
von Bildungsertragsraten angewandt werden. Dabei richtet sich das Hauptau- 
genmerk einerseits auf die Analyse der Entwicklung der Renditen und anderer- 
seits auf die empirische Evaluation des Ausmaßes der Unterschiede zwischen 
den alternativen Grenzen und der Vergleich der Annahme von MTS-MTR mit 
den traditionellen Schätzverfahren. 


Trotz teilweise sehr unterschiedlicher Arbeitsmärkte und Bildungssysteme wer- 
den bei der Analyse der Lohnstrukturen im internationalen Vergleich immer 
wieder gemeinsame Entwicklungen festgestellt. Die wichtigsten dieser „stili- 
sierten Fakten“ zur Entwicklung der Lohnstrukturen, insbesondere der Bildungs- 
renditen, werden zunächst in Abschnitt 4.1 beschrieben und dann in Abschnitt 
4.2 im internationalen Vergleich dargestellt. Von Interesse ist dabei die Frage 
inwieweit die Entwicklung der Lohnstruktur in Deutschland diese stilisierten 
Fakten nachzeichnet oder ob sich Sonderentwicklungen abzeichnen, verursacht 
beispielsweise durch die Wiedervereinigung oder die Position des Exportwelt- 
meisters. Anhand von Daten des Sozio-oekonomischen Panels des Deutschen 
Instituts für Wirtschaftsforschung (DIW) werden in Kapitel 5 eigene empirische 
Ergebnisse zu diesen Fragen vorgestellt. Nach der Beschreibung der Datenbasis 
und der Stichprobenselektion in Abschnitt 5.1 wird die Entwicklung der Lohn- 
struktur in Deutschland in Abschnitt 5.2 zunächst rein deskriptiv, differenziert 
nach Geschlecht, Kohorten und Bildungsjahren untersucht. Es zeigen sich schon 
hier große geschlechts-, kohorten- und bildungsspezifische Besonderheiten. So 
ist die Lohnverteilung der Frauen wesentlich symmetrischer als die der Männer, 
die jüngste Kohorte der Frauen und der Männer weisen die geringste Lohnsprei- 
zung auf und die absolute Streuung der durchschnittlichen realen Brutto- 
stundenlöhne ist bei höheren Bildungsniveaus signifikant größer als bei Haupt- 
und Realschule sowie Abitur als höchstem Bildungsabschluss. 
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In Abschnitt 5.3 werden mit den interessantesten in Kapitel 3 behandelten An- 
nahmen nichtparametrische Obergrenzen für Bildungsertragsraten bestimmt. 
Diese werden sowohl untereinander als auch mit den Punktschätzungen der Bil- 
dungsrenditen traditioneller Verfahren verglichen. Dabei bestätigt sich auch em- 
pirisch die Überlegenheit der Annahme von MTS-MTR zur Bestimmung von 
Obergrenzen. Als einzige von sechs Obergrenzen liefert sie über alle Kombina- 
tionen von Bildungsjahren hinweg ökonomisch sinnvolle Obergrenzen. Deshalb 
wird sie als einzige Obergrenze zur nichtparametrischen Analyse der Entwick- 
lung der Lohnstruktur in Abschnitt 5.4 ausgewählt. Hier werden sowohl Ergeb- 
nisse zu den beiden Psacharopoulos (1994) entnommenen mikroökonomischen 
stilisierten Fakten als auch zu der These des Rückgangs der Renditen insbeson- 
dere jüngerer Kohorten der Frauen und zum Beitrag der Bildung für die Mes- 
sung der Lohndiskriminierung vorgestellt. Es zeigen sich weder ein genereller 
Trend zum Sinken der Bildungsrenditen noch höhere Bildungsrenditen vollzeit- 
erwerbstätiger Frauen. Eindeutig erkennbar dagegen ist, dass die Bildungsren- 
diten vor allem von Frauen der Jahrgänge 1960-1975 im Vergleich zu den ande- 
ren Kohorten drastisch niedriger sind. Ebenfalls eindeutig fällt das Urteil zur 
Messung der Lohndiskriminierung aus. Hierbei zeigt sich die traditionelle Zer- 
legung nach Oaxaca/Blinder gegenüber der Verwendung nichtparametrisch ge- 
schätzten Obergrenzen im Ergebnis dramatisch überlegen. Die Schwankungen 
der nichtparametrischen Schätzung sind sehr hoch und bis auf sehr wenige Aus- 
nahmen nicht signifikant. 


4. Die Entwicklung der Bildungsrenditen im internationalen Vergleich 


Eine zentrale Fragestellung sowohl in der akademischen Analyse der unter- 
schiedlichen Entwicklungen der Arbeitsmärkte in Amerika und Europa seit den 
80er Jahren, als auch in der politischen Diskussion betrifft die folgende von 
Krugman formulierte Hypothese‘: 


“The European unemployment problem and the US inequality 
problem are two sides of the same coin.” 


Krugman (1994) 


Dieser Hypothese liegt die Auffassung zugrunde, dass die Arbeitsnachfrage in 
den USA und Europa seit den 80er Jahren denselben autonomen Schocks ausge- 


" Vgl. auch Freeman (1995), Beissinger/Moeller (1998), S. 2, und Krugman (1994), S. 68- 
81. 
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setzt war. Die Verschiebung der Qualifikationsstruktur durch technischen Fort- 
schritt, die Tertiärisierung und Globalisierung als die wichtigsten Schocks? für 
die Arbeitsnachfrage sowie ein zunehmendes Angebot an besser ausgebildeten 
Arbeitskräften auf der Angebotsseite führten demnach in den USA aufgrund der 
größeren Lohnflexibilität zu höherer Ungleichheit bei einer vergleichsweise 
günstigen Entwicklung der Arbeitslosigkeit. In Europa und insbesondere in 
Deutschland stieg die Arbeitslosigkeit aufgrund des vergleichsweise stark regu- 
lierten Arbeitsmarktes bei geringerer oder sogar abnehmender Ungleichheit, an. 
Gerade die Lohnstruktur in Deutschland wird häufig als starr bezeichnet, es wird 
daher auch von einer zunehmender Lohnkompression in Deutschland gespro- 
chen: 


“.. the earnings distribution has continued to become more com- 
pressed in Germany.” 


Zahlreiche empirische Studien haben sich der Beantwortung der Frage gewid- 
met, ob die Lohnkompression in Deutschland zugenommen hat. Stellvertretend 
für diese Studien* soll Fitzenberger (1999b) genannt werden, der diese Frage- 
stellung unter Verwendung verschiedenster Instrumentarien, von der deskripti- 
ven Beschreibung der Entwicklung der Lohnstruktur über eine detaillierte Ko- 
hortenanalyse bis hin zu einem strukturellen Modell der Lohnverhandlungen 
untersucht. Er verwendet dabei Daten der TAB-Beschäftigtenstichprobe, aller- 
dings nur für den Zeitraum 1975-1990, und kommt zu dem Ergebnis, dass die 
Charakterisierung der Lohnstruktur in Deutschland durch zunehmende Lohn- 
kompression viel zu undifferenziert ist und nicht nur die Wahl zwischen höherer 
Lohnungleichheit und höherer Arbeitslosigkeit besteht.” 


In Abschnitt 4.1 werden einer Arbeit von Psacharopoulos aus dem Jahr 1994 die 
wichtigsten stilisierten Fakten zur Entwicklung der Bildungsertragsraten im in- 
ternationalen Vergleich entnommen, da in ihr die empirischen Resultate der 
wichtigsten weltweiten Studien zu Bildungsrenditen verarbeitet und verglei- 
chend dargestellt werden. Zwei dieser stilisierten Fakten betreffen Entwick- 
lungen, die später anhand der SOEP-Daten im fünften Kapitel für Deutschland 
einer empirischen Überprüfung unterzogen werden sollen. Abschnitt 4.2 syste- 
matisiert und bewertet die Ergebnisse neuerer Forschungsarbeiten. 


? Vel. Pfeiffer/Falk (1999), S. 61, und Fitzenberger (1999b), S. 5 ff. 
° Vgl. OECD (1996), S. 63. 
Vgl. Steiner/Wagner (1997a, 1997b), Fitzenberger (1999a) sowie Fitzenberger/Franz 
(1997). 
° Vgl. auch Beissinger/Moeller (1998). 
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4.1 Stilisierte Fakten 


Angesichts der überwältigenden Anzahl und Vielfalt an Studien zu Bildungser- 
tragsraten® und deren Entwicklung ist es nötig, sich auf die zentralen Arbeiten 
zu beschränken. Als Ausgangspunkt zur Darstellung der wichtigsten stilisierten 
Fakten wird deshalb der in nahezu jeder neueren Veröffentlichung zu Bildungs- 
ertragsraten zitierte Überblicksartikel von Psacharopoulos (1994) gewählt, der 
eine Fortsetzung seiner, um nur die wichtigsten Arbeiten zu nennen, bereits 
1981 und 1985 durchgeführten Studien zu Bildungsertragsraten im internatio- 
nalen Vergleich darstellt’. Als zentrale stilisierte Fakten (SF) zu den Bildungs- 
renditen sind hier zu nennen‘: 


SFl: Mit zunehmendem Pro-Kopf-Einkommen eines Landes sinken tenden- 
ziell die Bildungsertragsraten. 


SF2: Je höher die durchschnittliche Anzahl an Bildungsjahren eines Lan- 
des, umso geringer sind tendenziell die durchschnittlichen Bildungs- 
ertragsraten. 


SF3: Es lässt sich ein Trend zu sinkenden Bildungsertragsraten im Zeitab- 
lauf erkennen. 


SF4: Frauen weisen höhere Bildungsertragsraten auf als Männer. 


Angesichts der steigenden Zahl der zur Verfügung stehenden Mikro-Datensätze 
und der europa- und weltweiten Bedeutung der Bildungsthematik lag es nahe, 
dass die Europäische Kommission ein Projekt startete, um unter anderem die 
Auswirkungen verschiedener Bildungssysteme auf die Bildungserträge zu unter- 
suchen. Dies wurde Ende 1998 im Rahmen des Projekts „Public Funding and 
Private Returns to Education (PURE)“ in Auftrag gegeben und schloss 15 euro- 
päische Länder ein: Dänemark, Deutschland, Finnland, Frankreich, Griechen- 
land, Großbritannien, Irland, Italien, Niederlande, Norwegen, Österreich, Portu- 


° Vgl. auch Psacharopoulos (1994), S. 1326ff. 

7 Vgl. Psacharopoulos (1981) und Psacharopoulos (1985). 

j Vgl. zu den Selektionskriterien Psacharopoulos (1994), S. 1326. Psacharopoulos 
unterscheidet des Weiteren zwischen einer ,,elaborierten“ Methode zur Bestimmung der 
Bildungsertragsrate, die darin besteht, den Diskontsatz zu finden, der den Strom der 
Einkommen aufgrund höherer Bildung den Kosten aufgrund entgangener Einkommen 
gleichsetzt (vgl. auch Psacharopoulos (1995), und der Mincer’schen 
Einkommensfunktion. Letztere unterteilt er dann ergänzend in eine Basis-, bei der die 
Anzahl der Bildungsjahre, und eine erweitere Einkommensfunktion, bei der 
Dummyvariablen für die Bildungsabschlüsse als Bildungsvariable verwendet werden. 
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gal, Schweden, Schweiz und Spanien. Die Ergebnisse wurden 2001 im Sammel- 
band „Education and Earnings in Europe‘? veröffentlicht und ergänzen die ver- 
gleichende Studie von Psacharopoulos (1994) in idealer Weise. Ein Teil der Ar- 
beiten, deren Ergebnisse im folgenden Abschnitt vor allem mit Blick auf die sti- 
lisierten Fakten dargestellt werden, steht in engem Zusammenhang mit dem 
PURE-Projekt. 


Im Mittelpunkt von Kapitel 5 werden eine empirische Analyse der zeitlichen 
Entwicklung der Bildungsertragsraten allgemein sowie im Vergleich zwischen 
Frauen und Männern (SF3 und SF4) stehen. Die stilisierten Fakten SF1 und SF2 
sind gerade mit Blick auf die angeführte „Krugman-These“ sehr interessant. 
Länder- und Systemvergleiche können im Rahmen mit dem für die Schätzungen 
in Kapitel 5 verwendeten SOEP-Datensatz jedoch nicht durchgeführt werden, so 
dass zur Überprüfung dieser stilisierter Fakten im weiteren die PURE-Studie 
verwendet wird. 


4.2 Ergebnisse neuerer empirischer Arbeiten 


Die vier stilisierten Fakten werden im folgenden getrennt nach makro- und mik- 
roökonomischen Thesen anhand der in Tabelle 4.1 aufgeführten Studien bespro- 
chen. Zwei dieser Studien, Lauer/Steiner (2000) und Trostel et al. (2001) bezie- 
hen sich auf alle vier genannten stilisierten Fakten. Die restlichen Studien be- 
schränken sich hauptsächlich auf die Punkte SF3 und SF4, also die Entwicklung 
der Bildungsertragsraten im engeren Sinne. Im Vergleich zu den mikroökonomi- 
schen werden die makroökonomischen Fakten nur kurz anhand der Sekundärli- 
teratur beurteilt, da sich die vorliegende Arbeit auf die Analyse der mikroöko- 
nomischen Fakten anhand der SOEP-Daten konzentriert. 


° Vgl. Harmon et al. (2001). 
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Tabelle 4.1: Ausgewählte Studien zur Entwicklung der Bildungsertragsraten 


Trend der Vergleich 
Renditen Männer-Frauen 
(SF3) (SF4) 


PURE-Projekt 


Pereira/Martins 


"Peso | | 


Tabelle 4.1 (fortgesetzt): 


o 
PURE-Projekt Je nach 
(2001) und Frauen 
Trostel et al. Männer . 
Qoo ea” 


Steiner/Lauer Deutsch- | Männer 
og TZ 


Nur 
Männer 


i a 
a | oe 
Se 


IV: Instrumentalvariablen, QR: Quantilregression 
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4.2.1 Studien zu den makroékonomischen stilisierten Fakten 


Zu den beiden makroökonomischen Fakten SET und SF2 finden sich zahlreiche 
empirische Arbeiten. In Topel (2000) findet sich ein Überblick über die bedeu- 
tendsten Studien zum Zusammenhang zwischen Humankapital und ökonomi- 
schem Wachstum aus makroökonomischer Sicht. Angesichts der unterschiedli- 
chen Ergebnisse bedeutender Studien wie die von Nelson/Phelps (1966), Lucas 
(1988), Benhabib/Spiegel (1994), DBarro/Sala-i-Martin (1995) und 
Aghion/Howitt (1998), um nur eine kleine Auswahl zu treffen, lassen sich die 
beiden bei Psacharopoulos formulierten stilisierten Fakten kaum so eindeutig 
bestätigen. Ein großes Problem dieser Studien liegt in der Vielfalt an Möglich- 
keiten zur Definition und Messung der Humankapitalvariablen. Dies erklärt die 
Unterschiedlichkeit der Ergebnisse. 


Eine sehr aktuelle empirische Arbeit zu diesen Zusammenhängen im internatio- 
nalen Vergleich stellt die Studie von Trostel et al. (2001) dar. Sie untersuchten 
für 28 Länder (darunter zehn Länder der PURE-Studie) auf der Grundlage ver- 
gleichbarer Daten (International Social Survey Programme Data) neben der 
Entwicklung der Bildungsrenditen im Zeitraum 1985-1995 sowohl den Zusam- 
menhang zwischen Pro-Kopf-Einkommen und Bildungsertragsraten eines Lan- 
des als auch zwischen der durchschnittlichen Anzahl an Bildungsjahren und den 
Bildungsrenditen.'” Auch ihre Studie kommt zu dem Schluss, dass die von 
Psacharopoulos (1994) formulierten Zusammenhänge einer detaillierten Analyse 
nicht standhalten. Dies wird durch die Studie von Lauer/Steiner (2000) bestätigt. 
Sie finden weder einen Trend zu sinkenden Bildungsertragsraten mit 
zunehmendem Pro-Kopf-Einkommen eines Landes noch einen systematischen 
Zusammenhang zwischen der durchschnittlichen Anzahl an Bildungsjahren und 
der durchschnittlichen Bildungsertragsrate eines Landes. Sie schließen daraus: 


„[...] dass sehr unterschiedliche Bildungssysteme und Arbeitsmarkt- 
strukturen mit ähnlichen Bildungsrenditen vereinbar sind und vice 


versa.“!! 


'° Sie schlussfolgern dies, obwohl es Probleme bezüglich des Vergleichs der Länder 
untereinander aufgrund unterschiedlicher Messung der Bildungsjahre und der Einkommen 
gibt. Trostel et al. (2001) verwenden Daten der Weltbank, so dass angesichts der Tätigkeit 
von Psacharopoulos für die Weltbank vermutet werden kann, dass in beiden Studien 
dieselben Daten verwendet wurden. Leider ist in Psacharopoulos (1994) nicht angegeben, 
welche Datenquellen seinen Grafiken zugrunde liegen. 

Vgl. Steiner/Lauer (2000), S. 28. 


— 
_ 
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4.2.2 Studien zu den mikroökonomischen stilisierten Fakten 


Die zuletzt genannte Problematik der Studien zu den makroökonomischen Fak- 
ten trifft im Grundsatz auch auf alle Studien zu den Bildungsrenditen im inter- 
nationalen Vergleich zu. So nimmt die Darstellung der Unterschiede in den ver- 
wendeten Variablen, der Stichprobenselektion und der Spezifikation bei den Ar- 
beiten von Psacharopoulos und anderer vergleichender Studien!” einen großen 
Raum ein. Die Besonderheit des bereits eingeführten PURE-Projekts besteht nun 
darin, dass in allen fünfzehn Ländern — soweit möglich!” — dieselbe Methodik, 
derselbe Zeitraum und dieselbe Spezifikation zur Schätzung der Mincer’schen 
Standardlohnfunktion und damit der Bildungsertragsraten und deren Entwick- 
lung verwendet wurde. Deshalb soll sie auch als Ausgangspunkt dieses Ab- 
schnittes dienen. In zwei der fünfzehn Länder wurde bei den Männern, in drei 
bei den Frauen ein Abwärtstrend, in fünf Ländern ein Aufwärtstrend bei den 
Männern und Frauen festgestellt. In Österreich und Schweden wurde bei Män- 
nern und Frauen ein Abwärtstrend, in Dänemark, Portugal und Italien jeweils 
ein Aufwärtstrend verzeichnet. Insgesamt ergibt sich damit kein eindeutiger 
Trend, auch nicht nach Berücksichtigung der geografischen Lage der Länder, da 
in Dänemark und Schweden entgegengesetzte Trends zu beobachten sind. In elf 
der Länder weisen Frauen höhere Renditen auf. Mit Abstand die größte Diffe- 
renz zwischen den Renditen der Männer und Frauen ergibt sich in Irland mit bis 
zu sieben Prozentpunkten, aber auch in Großbritannien, Deutschland und Grie- 
chenland ist der Abstand mit zwei bis vier Prozentpunkten beträchtlich. 


Für die achtundzwanzig Länder ergab sich ein geringer Trend zum Sinken der 
Bildungsertragsraten, der für Deutschland immerhin einen Wert von 0,2 Pro- 
zentpunkten pro Jahr ausmacht.'* Die Bildungsrendite ist nicht in jedem Land 
am Ende des Betrachtungszeitraums niedriger als am Anfang. Dies bestätigt die 
Studie von Psacharopoulos. Bekräftigt werden konnte auch der Renditeunter- 
schied zwischen Frauen und Männern. Mit Ausnahme der Niederlande, Neu- 
seeland, Nordirland und Spanien sind die Renditen der Frauen deutlich höher als 
die der Männer. 


12 Vgl. Brunelio/Comi (2000). 

B Vgl. Harmon et al. (2001), S. 8. Im Unterschied zu den übrigen Ländern standen für 
Österreich, Griechenland, Italien, Spanien und die Niederlande anstelle von 
Bruttostundenlöhnen nur Nettostundenlöhne zur Verfügung. 

l4 Vel. Wagner/Lorenz (1988), S. 96, Tabelle 1, die zeigt, wie groß die Variation der 
geschätzten Bildungsertragsraten in Abhängigkeit vom verwendeten Datensatz sein kann. 
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Die Bildungsertragsraten im engeren Sinne werden in der von Lauer/Steiner 
(2000) durchgefiihrten Studie untersucht. Sie untersuchen die Entwicklung der 
Bildungsertragsraten fiir Manner und Frauen in der Periode von 1984-1997 fiir 
vierzehn europäische Länder, bis auf die Schweiz mit denselben Ländern wie im 
PURE-Projekt'”, und schließen, dass der durchschnittliche Ertrag bei den Frauen 
stabil mehr als zwei Prozentpunkte über dem der Männer liegt. Dabei muss aber 
beachtet werden, dass ihre Stichprobe sowohl teilzeit- als auch vollzeiterwerbs- 
tätige Frauen beinhaltet und von ihnen nach Voll- und Teilzeiterwerbstätigkeit 
getrennte Regressionen ergeben, dass die Renditen der vollzeiterwerbstätigen 
Frauen etwa 2 Prozentpunkte niedriger sind als die Renditen vollzeiterwerbstäti- 
ger Männer. Die in der PURE-Studie festgestellte Stabilität der durchschnittli- 
chen Ertragsrate in der untersuchten Periode wird dahingehend bestätigt, dass in 
den meisten Ländern die Renditen entweder gesunken oder konstant geblieben 
sind. Für die Entwicklung in Deutschland zeigte sich für Frauen und Männer 
eine geringe Abwärtstendenz. Das Selektionsproblem bei Frauen berücksichti- 
gen sie über das zweistufige Heckman-Verfahren. Der Selektionskorrekturterm 
war in allen Fällen signifikant und führte immer zu Renditen unterhalb der 
Schätzungen ohne Selektionskorrektur, wobei die Differenz jedoch auf dem 5%- 
Niveau in keinem der Fälle signifikant war. 


Zusätzlich zu den stilisierten Fakten, die wir bereits aufgeführt haben, untersu- 
chen Lauer/Steiner (2001) auch Kohorteneffekte. Sie kommen zu dem Schluss, 
dass in Deutschland die Bildungsrenditen jüngerer Geburtskohorten insbeson- 
dere bei den Frauen deutlich gesunken sind. Dieses Ergebnis wird im fünften 
Kapitel mit eigenen Untersuchungen und einer leicht unterschiedlichen Kohor- 
tendefinition noch näher diskutiert. Ebenfalls interessant für den Vergleich mit 
den Ergebnissen in Kapitel 5 sind die Instrumentalvariablenschätzungen. Im 
Gegensatz zu vielen anderen Arbeiten, die Instrumente für die Bildungsvariable 
verwenden, erhalten Lauer/Steiner mit 5 verschiedenen Modellen Bildungsren- 
diten für das Jahr 1995, die nicht systematisch über denen der Mincer’schen 
Standardlohnfunktion liegen.’ Dabei verwenden sie die vier Instrumente 
„Bildungsniveau der Mutter oder des Vaters“, „Beschäftigungstyp und Bil- 
dungsniveau des Vaters“ allein oder kombiniert sowie Indikatoren für ver- 
schiedene Lebensumstände während der Kindheit”. 


Dies liegt wie schon abgedeutet daran, dass die Arbeiten an diesem Papier im Rahmen des 
PURE-Projekts erfolgt sind. 
16 Dies gilt gleichermaßen für Männer und Frauen. Dies zeigt einmal mehr die Sensitivität 
der Ergebnisse auf die Wahl des Instrumentes. 
Bildung des Vaters im Alter des Individuums von 15 Jahren. Indikatoren: 
Dummyvariablen für die drei Instrumente „Eltern waren überwiegend beschäftigt“, 
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Pereira/Martins (2001b) verwenden in ihrer Studie denselben Zeitraum, auf- 
grund ihrer Mitarbeit am PURE-Projekt die dort berücksichtigten fünfzehn Län- 
der und ergänzen die OLS-Regressionen um Quantilsregressionen. Sie betrach- 
ten jedoch lediglich vollzeiterwerbstätige Männer, so dass der Punkt SF4 nicht 
beurteilt werden kann. Sie ziehen aufgrund der Verwendung der Ergebnisse des 
PURE-Projekts für die einzelnen Länder dieselbe Schlussfolgerung wie 
Lauer/Steiner, dass kein positiver Trend, allenfalls ein leichtes Sinken der Bil- 
dungsertragsraten erkennbar ist. Die im Vergleich zu den Studien von Psacharo- 
poulos zusätzlich zu den Standard-OLS-Regressionen durchgeführten Quantil- 
regressionen verwenden sie, um die Abhängigkeit der Lohnungleichheit vom 
Bildungsniveau zu untersuchen. Für sieben Länder, zu denen auch Deutschland 
zählt, ergibt sich, dass zwischen 1980 und 1995 der Ertrag des 10%-Quantils 
gesunken ist. Sie folgern daraus: 


„[...] the role of education for the less attractive to the labour market 
has been eroded during the last two decades“'® 


Für die Lander, bei denen der Ertrag beim 10%-Quantil in der Tat stärker sank 
als beim 90%-Quantil, ist diese Folgerung sicher nahe liegend. In Deutschland 
sank der Ertrag gemäß ihren Schätzungen am 10%-Quantil von 1984 auf 1995 
von 9% auf 8,2%.” Berücksichtigt man jedoch, dass der Ertrag beim 90%- 
Quantil von 8,1% auf 7,2% im gleichen Zeitraum sank, also um 0,1 Prozent- 
punkte stärker”, muss man mit der Übertragung dieser Aussage auf die Ent- 
wicklung in Deutschland vorsichtig sein. Die Aussage wird durch die Berück- 
sichtigung der Entwicklung beim 90%-Quantil relativiert. Nicht nur in diesem 
Fall nimmt Deutschland — zusammen mit Frankreich, Italien und Großbritannien 
— eine Sonderrolle ein. Nur in Griechenland und Deutschland sind die Erträge 
bei den höheren Lohnquantilen niedriger als bei den unteren. 


Umfangreiche Anwendungen von Quantilregressionen auf die Bildungsertrags- 
raten in den USA sind in Buchinsky (1994, 1995) für den Zeitraum von 1963 bis 
1987 und in Buchinsky/Leslie (1997) für 1964 bis 1994 zu finden. Seit Beginn 
der achtziger Jahre ist ein fast stetiges Steigen der Bildungsertragsraten an allen 


„Individuum wuchs mit beiden Elternteilen auf" sowie „Individuum wuchs in ländlichem 
oder städtischem Gebiet auf“. 

ii Vgl. Pereira/Martins (2001b), S. 46. 

S Vgl. auch Lorenz/Wagner (1993) und Wagner (1990) zu Studien, die Bildungsertragsraten 
fiir Deutschland schatzen. 

2 Vgl. Pereira/Martins (2001b), S. 46. Von 1986 auf 1995 fiel die Ertragsrate beim 90%- 
Quantil sogar um 0,4 Prozentpunkte stärker als beim 10%-Quantil. 
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Quantilen zu verzeichnen, wobei die Renditen mit elf bis vierzehn Prozent deut- 
lich über den Renditen in den europäischen Ländern liegen. Zudem zeigt sich 
eine Zunahme der Ungleichheit sowohl bei der Differenz des 90%- und des 
10%-Quantils als auch beim 75%- und 25%-Quantil. 


Eine weitere wichtige, in den USA bereits seit über 20 Jahren”', in Deutschland 
jedoch erst seit 1995 empirisch untersuchte Fragestellung besteht in der Auf- 
deckung von Kohorteneffekten, die unterschiedliche Entwicklungen der Bil- 
dungsertragsraten verschleiern können. Fitzenberger et al. (1995) untersuchen 
als erste mit Daten der Bundesanstalt für Arbeit Kohorteneffekte für Männer im 
Zeitraum 1976-1984. Dieselbe Methodik wird in der bereits erwähnten Arbeit 
von Fitzenberger (1999b) auf den Zeitraum 1974-1990 ausgedehnt. Fitzenberger 
kommt unter Berücksichtigung eines makroökonomischen Trends und durch 
detaillierte Schätzung der Lohnverteilung anhand von Quantilregressionen zu 
drei wichtigen Ergebnissen.” Erstens hat die Lohnungleichheit zwischen Arbei- 
tern mit niedriger und mittlerer Qualifikation trotz einer Zunahme der Ungleich- 
heit der gesamten Lohnverteilung abgenommen. Zweitens hat die Ungleichheit 
bei mittlerer und höherer Qualifikation” zugenommen und drittens stieg sie in- 
nerhalb aller drei Qualifikationsniveaus. Boockmann/Steiner (2000) verwenden 
SOEP-Daten für den Zeitraum 1984-1997, um Kohorteneffekte für Männer und 
Frauen zu schätzen. Sie finden deutliche geschlechtsspezifische und kohorten- 
spezifische Unterschiede in der Entwicklung der Renditen. Die Bildungsertrags- 
raten fielen in jüngeren Kohorten bei Frauen deutlich und meistens signifikant. 
Für Männer konnten sie zwar ebenfalls ein Sinken der Bildungsrenditen fest- 
stellen, dieses fällt jedoch deutlich geringer und weniger signifikant aus.” Die 
Ursachen der unterschiedlichen Entwicklung bei Männern und Frauen wurden 
nicht untersucht, die Autoren führen neben der Veränderung der Arbeitsnach- 
frage als wahrscheinlichste Erklärung die signifikante Zunahme der Erwerbstä- 
tigkeit der Frauen an. 


2 


Vgl. Welch (1979) und Freeman (1979). 
"7 Obwohl in dem Modell keine Bildungsertragsraten nach der Mincer’schen 
Standardeinkommensfunktion geschätzt werden, ist sie wegen der Analyse der 
Lohnstruktur zur Beurteilung der stilisierten Fakten unverzichtbar. 
Bei höherer Qualifikation hängt die Entwicklung entscheidend vom betrachteten Quantil 
ab. Beim 20%-Quantil stiegen die Löhne weniger, beim 50%-Quantil stärker als bei 
mittlerer Qualifikation. Vgl. Fitzenberger (1999b), S. 54f. 
Im Unterschied zu den bisher angeführten Studien verwenden Boockmann/Steiner nomi- 
nale Nettostundenlöhne, testen neben der Standardeinkommensfunktion auch Spezifikatio- 
nen mit Dummyvariablen für Bildungsabschlüsse und verwenden in beiden Varianten In- 
teraktionseffekte zwischen den Bildungsvariablen und der Erfahrungsvariablen. 
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Der in der empirischen Forschung für Deutschland jüngste Ansatz besteht in der 
Verwendung von Instrumentalvariablen, um Bildungsrenditen auf der Grundlage 
der in Kapitel 2 angeführten LATE-Schätzer zu bestimmen. Es finden sich in 
der Literatur eine Vielzahl von Studien, in denen mit Hilfe von Instrumentalva- 
riablen, wie beispielsweise der Bildung der Eltern, Bildungsertragsraten ge- 
schätzt wurden, die signifikant und deutlich über denen der Standardeinkom- 
mensfunktion liegen. Dies wurde lange Zeit als Beleg dafür gewertet, dass die 
Renditen bei Verwendung Mincer’schen Spezifikation nach unten verzerrt sind. 
Ein mögliche Erklärung liefern, wie in Kapitel 2 schon angesprochen, bei- 
spielsweise Card (1995, 1999) und Angrist et al. (1996). Sie vermuten, dass der 
zum Teil bis zu zehn Prozentpunkte ausmachende Unterschied letztlich auf dem 
Heterogenitätsproblem beruht, da die LATE-Schätzungen als IV-Schatzungen 
interpretiert werden können.” Mit den jeweiligen Instrumenten werden nur Teil- 
gruppen der Stichprobe erfasst, deren Renditen deutlich über dem Durchschnitt 
liegen können. Die Ergebnisse der IV-Schätzungen würden demnach nicht im 
Widerspruch zu den Renditen aufgrund der Standardschätzungen stehen. 
Becker/Siebern-Thomas (2001) und Ichino/Winter-Ebmer (1999) führen solche 
LATE-Schätzungen durch und verwenden hierbei Informationen über den fami- 
liären Hintergrund als Instrumente. In beiden Studien werden SOEP-Daten ver- 
wendet, wobei Ichino/Winter-Ebmer Daten des Jahres 1986 und Becker/ 
Siebern-Thomas Daten von 1985 und 1995 verwenden. Beide Studien kommen 
zu dem Ergebnis, dass das Heterogenitätsproblem für die große Bandbreite der 
geschätzten Renditen bei verschiedenen Instrumenten verantwortlich ist. 
Becker/Siebern-Thomas ziehen beispielsweise den Schluss, dass Personen aus 
schwachen sozialen Verhältnissen mit niedrigem Bildungsniveau am stärksten 
auf das Instrument „Ort der Kindheit“ reagieren, während Personen aus 
gehobenen Verhältnissen weniger stark auf dieses Instrument reagieren, jedoch 
dann am stärksten bei höherem Bildungsniveau.”° 


Im folgenden Kapitel 5 werden eigene Schätzungen zur Entwicklung der Lohn- 
struktur und speziell der Bildungsrenditen vorgestellt. Nach der Darstellung der 
Datenbasis und der Stichprobenselektion werden in Abschnitt 5.2 deskriptive 
Analysen zur Entwicklung verschiedener Charakteristika der Lohnverteilung 
von 1984-2000 gezeigt, da die bisher veröffentlichten Analysen hierzu lediglich 
das Jahr 1997 einschließen. In Abschnitt 5.3 erfolgt eine Evaluation der nichtpa- 
rametrisch geschätzten Obergrenzen und in Abschnitt 5.4 der Arbeit werden die 
stilisierten mikroökonomischen Fakten, kohortenspezifische Entwicklungen so- 


> Vgl. Angrist et al. (1996). 
2° Vgl. Becker/Siebern-Thomas (2001), S. 21. 
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wie Instrumentenschätzungen anhand von SOEP-Daten untersucht. Insbeson- 
dere werden MTS-MTR-Obergrenzen für die verschiedenen geschätzten Rendi- 
ten bestimmt und untersucht, inwiefern sich daraus Konsequenzen fir die Beur- 
teilung der stilisierten Fakten SF3 und SF4 sowie der Größenordnung der Ren- 
diten bei Verwendung der verschiedenen Spezifikationen ableiten lassen. 
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5. Bildungsrenditen in Deutschland 


Nachdem im vorangegangenen Kapitel Ergebnisse von Studien zur Entwicklung 
der Bildungsertragsraten im internationalen Vergleich besprochen wurden, wer- 
den im fünften Kapitel eigene Schätzungen zur Entwicklung der Bildungsrendi- 
ten in Deutschland vorgestellt. Wahrend die meisten Studien fiir Deutschland 
lediglich Daten bis zum Jahr 1997 beriicksichtigen, werden in der vorliegenden 
Studie erstmals Daten einschlieBlich des Jahres 2000 verwendet, so dass neben 
einer Uberpriifung bisheriger Ergebnisse die Analyse der Entwicklung im Zeit- 
ablauf erweitert werden kann. Erstmalig wird ebenfalls eine systematische empi- 
rische Evaluation verschiedener nichtparametrischen Obergrenzen sowohl fiir 
Renditeschätzungen der Standardlohnfunktion als auch für Instrumentenschätzer 
vorgenommen. Dabei werden alle Analysen auch kohortenspezifisch durchge- 
führt, um die Entwicklung der Lohnstruktur so differenziert wie möglich beur- 
teilen zu können. 


In Abschnitt 5.1 wird zunächst der Datensatz des Sozio-oekonomischen Panels 
(SOEP) und die Stichprobenselektion beschrieben. Abschnitt 5.2 analysiert reale 
Bruttostundenlöhne deskriptiv im Zeitablauf, differenziert nach Geschlecht, Ko- 
horten und Bildungsjahren. Schon hier werden sich deutliche geschlechts-, ko- 
horten- und bildungsspezifische Unterschiede zeigen. In Abschnitt 5.3 werden 
nichtparametrisch geschätzte Obergrenzen der Renditen im Vergleich unterein- 
ander und mit Standardschätzungen evaluiert. Verschiedene nichtparametrische 
Obergrenzen für die Standardlohnfunktion werden in Abschnitt 5.3.1 verglichen. 
Es zeigt sich, dass man bei Verwendung der Annahme von MTS-MTR durch- 
weg die mit Abstand niedrigsten, teilweise nur 2 bis 4 Prozentpunkte höhere 
Punktschätzungen als OLS, und ökonomisch plausibelsten Obergrenzen erhält. 
In Abschnitt 5.3.2 werden nichtparametrische MIV-MTR-Obergrenzen für Bil- 
dungsrenditen geschätzt und mit den entsprechenden IV-Schätzungen vergli- 
chen. Diese nichtparametrischen Schätzungen liegen größenordnungsmäßig mit 
etwa 20 Prozentpunkten zwar deutlich über den MTS-MTR-Obergrenzen für die 
Renditen der Standardlohnfunktion, jedoch immerhin größtenteils im Rahmen 
von Instrumentenschätzungen einiger Studien. In dem abschließenden Abschnitt 
5.4 werden mit der Annahme von MTS-MTR und Standardschätzungen drei 
Thesen zu der Lohnstruktur und deren Entwicklung sowie die Lohndiskriminie- 
rung von Frauen in Deutschland untersucht. Mit Blick auf die beiden stilisierten 
Fakten zeigt sich, dass die Bildungsrenditen der Frauen von 1984 bis 1992 von 
7,5 Prozent auf knapp über 6 Prozent fast stetig gesunken sind und nach starken 
Schwankungen von 6,2 Prozent im Jahr 1998 auf wiederum 7,5 Prozent im Jahr 
2000 gestiegen sind. Bei den Männern verlief die Entwicklung obwohl gewisse 
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Parallelen zu den Frauen erkennbar sind, weniger systematisch, jedoch wird wie 
bei den Frauen mit die höchste Rendite im Jahr 2000 erreicht. Des Weiteren 
bestätigt sich, dass die Bildungsrenditen der vollzeiterwerbstätigen Frauen fast 
durchweg um etwa einen halben bis einen Prozentpunkt niedriger als die der 
Männer sind. Noch niedriger im Vergleich zu den übrigen Kohorten und den 
Renditen der Männer sind auch die Renditen der jüngsten Kohorte der Frauen. 
Bei der abschließenden erstmaligen Anwendung der nichtparametrischen Gren- 
zen auf die Messung der Lohndiskriminierung deutet sich eine Überlegenheit 
des traditionellen, auf OLS-Regressionen basierenden Oaxaca/Blinder- Ansatzes 
an. 


5.1 Datenbasis und Stichprobenselektion 


Zur Schätzung der Bildungsrenditen werden Daten des Sozio-oekonomischen 
Panels für den Zeitraum 1984 bis 2000 für Westdeutschland verwendet. Das 
SOEP stellt eine repräsentative Längsschnittbefragung der in Deutschland le- 
benden Bevölkerung dar. Dabei wurden in der ersten Welle im Jahr 1984 etwa 
12000 Individuen in ca. 6000 Haushalten zu sozio-ökonomischen Themen be- 
fragt. 1984 gab es zwei Stichproben, A (Deutsche West) und B (Ausländer). Da 
sich die Bildungsabschlüsse der Ausländer aus den so genannten „Gastarbeiter- 
ländern“, die Ende der fünfziger und Anfang der sechziger Jahre nach Deutsch- 
land gekommen sind, grundlegend von denen der Stichprobe A unterscheiden, 
werden diese wie in den meisten Studien von der Analyse ausgeschlossen. Eben- 
falls nicht in die Analyse aufgenommen wurden die vier später hinzugekomme- 
nen Stichproben C-F (Deutsche OST ab 1990, Zuwanderer ab 1995, Querschnitt 
98 ab 1998, Erweiterung 2000), um einen möglichst langen Untersuchungszeit- 
raum und eine möglichst homogene Stichprobe zu erhalten. Es werden des 
Weiteren nur Vollzeit Erwerbstätige, nichtselbständige Männer und Frauen im 
Alter von 25 bis 55 Jahren betrachtet, um Einflüsse auszuschließen, die von 
Ausbildungs- und Verrentungsphasen ausgehen könnten. Als abhängige Vari- 
able wird der reale Bruttostundenlohn in Preisen von 1995 verwendet, der aus 
den Angaben zum Monatsbruttolohn' (in DM), der tatsächlich geleisteten Ar- 
beitszeit” und dem Verbraucherpreisindex ermittelt wurde.” Für die Anzahl der 
Schuljahre wurden die auf der Basis von Schwarze (1991, 1996) und Helberger 


l 


Dieser bezieht sich auf den Monat, der dem Befragungszeitpunkt voraus ging. 
2 


Die Ergebnisse ändern sich nur äußerst geringfügig, wenn zur Berechnung anstelle der 
tatsächlichen die vereinbarte Wochenarbeitszeit verwendet wird (eigene Schätzungen). 

> Vgl. Jacobebbinghaus (2002), S. 215ff, zur Problematik der Berechnung von 
Stundenlöhnen in verschiedenen Datensätzen, unter anderem auch des SOEP-Datensatzes. 
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(1988) generierten Werte verwendet.’ Damit werden folgende Umrechnungen 
verwendet: 


Tabelle 5.1: Umrechung der Bildungsabschlüsse in Bildungsjahreinheiten 


Höchster Schulabschluß Beruflicher Bildungs- und Hochschulabschluss 


Lehre Berufsfach- Universität 
Haupt- | Real- ; Fachhoch- 
FH | Abitur | Beamten- schule Technische 
schule | schule schule 
ausbildung | Fachschule Hochschule 


Als Kohorten wurden die Jahrgänge 1930-1939 (Kohorte 1), 1940-1949 (Ko- 
horte 2), 1950-1959 (Kohorte 3) und 1960-1975 (Kohorte 4) gebildet. 


5.2 Zur Entwicklung der Löhne im Zeitverlauf 


In den folgenden Abschnitten wird die Entwicklung der Verteilung der realen 
Bruttostundenlöhne in Deutschland von 1984 bis 2000 anhand von Durch- 
schnittslöhnen, Quantilen sowie Quantilabständen dargestellt. In Abschnitt 5.2.1 
wird nach Geschlecht, in Abschnitt 5.2.2 und 5.2.3 zusätzlich nach Kohorten 
bzw. Bildungsjahren und abschließend in Abschnitt 5.2.4 nach Kohorten und 
Bildungsjahren differenziert. 


5.2.1 Diffenzierung nach Geschlecht 


Auf der Basis der in Abschnitt 5.1 beschriebenen Selektionskriterien erhält man 
die in Tabelle 5.1 aufgeführten Fallzahlen für die einzelnen Jahre und die ent- 
sprechenden Entwicklungen der durchschnittlichen realen Bruttostundenlöhne 
für Männer und Frauen, die in Abbildung 5.1 auch grafisch dargestellt sind. 


* Eine Übersicht zu alternativen Umrechnungen ist in Dworschak (1986), S. 285, zu finden. 
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Tabelle 5.2: Durchschnittliche reale Bruttostundenldhne in DM und 
Fallzahlen nach Jahr und Geschlecht, 1984-2000 


ae 1984 1985 1986 1987 1988 1989 1990 1991 1992 


Manner 27.59 27.46 28.52 29.67 30.36 30.61 31.47 31.49 31.78 
1679 1547 1494 1532 1481 1502 1467 1433 1397 


Frauen 21.37 21.95 22.31 22.97 24.00 23.98 24.39 24.49 24.95 


509 502 518 525 510 535 535 546 556 


aa 1993 1994 1995 1996 1997 1998 1999 2000 


Manner 32.51 32.36 32.37 33.18 32.58 32.41 33.12 33.56 
1386 1361 1340 1329 1313 1256 1268 1232 
Frauen 25.40 25.88 26.32 26.80 26.78 26.59 27.10 27.44 
574 562 549 544 551 513 507 494 


Abbildung 5.1: Zeitliche Entwicklung der durchschnittlichen realen Brutto- 
stundenlöhne vollzeiterwerbstätiger Männer und Frauen in 
Deutschland von 1984-2000 


Männer —- - - - Frauen 


N CA CA 
oa oO Ru 


durchschnittlicher realer Bruttostundenlohn 


N 
© 


1985 1990 1995 2000 
Jahr 
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Während die Fallzahl bei den Männern aus verschiedenen Gründen 
(Panelsterblichkeit, Zunahme der Arbeitslosigkeit, Veränderung der Alters- 
struktur) kontinuierlich abgenommen hat und im Jahr 2000 nur noch ca. 73% im 
Vergleich zum Jahr 1984 beträgt, hat die Zahl der vollzeiterwerbstätigen Frauen 
wegen der kohortenbedingt steigenden Erwerbsbeteiligung der Frauen bis 1993 
um gut zwölf Prozent zugenommen und ist auf Grund konjunktureller Effekte 
bis zum Jahr 2000 wieder auf das Ausgangsniveau zurückgefallen. Der durch- 
schnittliche reale Bruttostundenlohn der Männer ist im Gesamtzeitraum um 1,23 
Prozent gestiegen. Die Frauen konnten hier einen leicht höheren Anstieg um 
1,57 Prozent durchschnittlich jährlich verzeichnen. Dies macht zwar über den 
gesamten Zeitraum immerhin 7 Prozentpunkte mehr für die Frauen aus. Ange- 
sichts des Unterschiedes von 6 DM pro Stunde im Jahr 2000 und einem immer 
noch um 22 Prozent höheren Durchschnittslohn der Männer ist eine Anglei- 
chung noch in weiter Ferne. Bei einer konstant um 0,34 Prozentpunkte höheren 
jährlichen Wachstumsrate der Frauen würde die Angleichung der Durch- 
schnittslöhne noch 60 Jahre dauern. Bis 1996 verlief der Anstieg der Löhne mo- 
noton, von 1996 bis zum Jahr 2000 mussten Männer und Frauen erstmals auch 
teilweise leichte reale Einbußen hinnehmen. 


Betrachtet man zusätzlich zu den Durchschnittslöhnen die Entwicklung der 
Quantile der Lohnverteilung, dargestellt in den Abbildungen 5.2 und 5.3, sind 
mehrere Auffälligkeiten festzustellen: 


e Der Median der Frauen liegt in jedem Jahr wesentlich dichter am arithme- 
tischen Mittel als bei den Männern. Dies deutet auf eine symmetrischere, 
weniger linkssteile Verteilung der realen Bruttostundenlöhne als bei den 
Männern hin. Dies zeigt sich auch bei Betrachtung von Kerndichteschät- 
zungen der Lohnverteilungen der Männer und Frauen, auf deren Wieder- 
gabe jedoch verzichtet wird. 


e Die Entwicklung der unteren Quantile (hier 10% und 25%), des Medians 
und des Durchschnitts verläuft bei den Männern durchgehend deutlich 
flacher als bei den Frauen. Vollzeiterwerbstätige Frauen holen demnach 
im Bereich geringerer Stundenlöhne stärker auf. Bei den oberen Quantilen 
ist der Aufholprozess der Frauen schwächer. In Tabelle 5.2 sind die 
durchschnittlichen Wachstumsraten in Prozent für die verschiedenen 
Kenngrößen der Lohnverteilung ausgewiesen. 
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Tabelle 5.3: Durchschnittliche jährliche Wachstumsraten der realen 
Bruttostundenlöhne in Prozent, 1984-2000, für ausgewählte 


Kenngrößen der Lohnverteilung 
10%- 25%- Arithm. 75%- 90%- 
l Median . ; 
Quantil Quantil Mittel Quantil Quantil 


e Die Lohnspreizung, gemessen anhand verschiedener Quantilsabstände in 
Tabelle 5.3, ist bei den Männern bis auf zwei Ausnahmen wesentlich 
größer als bei den Frauen. Bei den Abständen 50%-10% und 25%-10% 
wurde das Maximum im Jahr 2000 und das Minimum im Jahr 1984 
erreicht. Die Betrachtung der Wachstumsraten der Abstände in Tabelle 
5.4 zeigt, dass die Lohnspreizung bei den Männern im unteren und 
mittleren Bereich der Lohnverteilung wesentlich stärker zunimmt als bei 
den Frauen. Diese verzeichnen die größte Zunahme der Lohnspreizung im 
oberen Bereich und dort auch stärker als bei den Männern. Dies beruht 
vor allem auf der Veränderung der relativen Position des 90%-Quantils. 


Tabelle 5.4: Minimale und maximale Bandbreiten der Quantilsabstände 
in DM im Zeitraum 1984-2000 


90%-10%- | 90%-75%- | 90%-50%- | 50%-10%- | 25%-10%- | 75%-25%- 
Quantil Quantil Quantil Quantil Quantil Quantil 


Tabelle 5.5: Durchschnittliche jährliche Wachstumsraten ausgewählter 
Quantilsabstände in Prozent, 1984-2000 


90%-10%- | 90%-75%- | 90%-50%- | 50%-10%- | 25%-10%- | 75%-25%- 
Quantil Quantil Quantil Quantil Quantil Quantil 
"reel all meim Iw 


Im nächsten Abschnitt wird sich zeigen, ob die gerade beschriebene generelle 
Entwicklung der Reallöhne auf alle Kohorten gleichermaßen zutrifft oder ob 
sich besondere kohortenspezifische Entwicklungen beobachten lassen, die z.B. 
mit der gestiegenen Erwerbsbeteilung der Frauen zusammenhängen. 
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Abbildung 5.2: Zeitliche Entwicklung der Verteilung der realen Bruttostun- 
denlöhne vollzeiterwerbstätiger Männer in Deutschland 


Durchschnittlicher realer Bruttostundenlohn 


1985 1990 1995 2000 
Jahr 


Abbildung 5.3: Zeitliche Entwicklung der Verteilung der realen Bruttostun- 
denlöhne vollzeiterwerbstätiger Frauen in Deutschland 


Durchschnittlicher realer Bruttostundenlohn 


1985 1990 1995 2000 
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5.2.2 Differenzierung nach Geschlecht und Kohorten 


In den Tabellen 5.5 und 5.6 und den Abbildungen 5.4 bis 5.6 wird die Betrach- 
tung weiter verfeinert, indem die Entwicklung der durchschnittlichen realen 
Bruttostundenlöhne nach den vier Geburtsjahrgangskohorten 1930-1939 (Ko- 
horte 1), 1940-1949 (Kohorte 2), 1950-1959 (Kohorte 3) und 1960-1975 (Ko- 
horte 4) dargestellt wird. 


Tabelle 5.6: Durchschnittliches jährliches Wachstum der durchschnittlichen 
realen Bruttostundenléhne in Prozent nach Kohorten und 
Vergleichszeiträumen” 


Ko- Frauen Männer 
horte | 1985-1992 | 1985-2000 | 1995-2000 | 1985-1992 | 1985-2000 | 1995-2000 
pl | os | - [| - | 220 [| - | - | 
2,13 


Bei der Differenzierung nach Kohorten fallen folgende Besonderheiten auf: 


e Während im vorigen Abschnitt festgestellt werden konnte, dass die Real- 
löhne der Frauen durchschnittlich jährlich um 0,34 Prozentpunkte stärker 
gestiegen sind, zeigt sich bei der Differenzierung nach Kohorten, dass die 
durchschnittlichen realen Bruttostundenlohnsätze der Männer in allen 
Kohorten bei fast allen Vergleichszeiträumen deutlich stärker als die der 
Frauen zunahmen. Dies ist auf die unterschiedliche Zusammensetzung 
und die unterschiedliche Änderung der Kohorten zurückzuführen. 


e Am stärksten, fast durchweg einen Prozentpunkt pro Jahr mehr im Ver- 
gleich zu den Kohorten 1 und 2, stiegen bei den Männern die Durch- 
schnittslöhne der Kohorten 3 und 4, unabhängig davon, welchen Ver- 
gleichszeitraum man zugrunde legt. Dies spiegelt bei den Männern haupt- 
sächlich den Einfluss der Berufserfahrung auf die Entwicklung der Löhne 
wider. 


° Wie Tabelle 5.6 zeigt, sind für die Kohorte 1 die Fallzahlen 1993 und 1994 so gering, dass 
angesichts der Bedeutung des Endzeitpunktes 1992 gewählt wurde. Als Anfangszeitpunkt 
wurde 1985 gewählt, da hier die ersten Beobachtungen für die Kohorte 4 auftreten. 
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e Bei den Frauen dagegen sind die Unterschiede zwischen den Kohorten 
gering, die zweite Kohorte weist im Gegensatz zu den Männern für jeden 
Vergleichszeitraum sogar mit die höchste Wachstumsrate auf. Verant- 
wortlich hierfür sind hauptsächlich Sondereffekte, wie beispielsweise die 
im Vergleich zu den Männern vor allem bei der zweiten und dritten Ko- 
horte der Frauen ausbildungsbedingte stärkere Tarifgebundenheit der 
Löhne. 


Abbildung 5.4: Zeitliche Entwicklung der durchschnittlichen realen Brutto- 
stundenlöhne in Deutschland nach Geschlecht und Kohorten 
von 1984-2000 


Bh Ke Ss 


Bis ce 


e Betrachtet man zusätzlich die Quantile der Lohnverteilung in den Abbil- 
dungen 5.5 und 5.6, zeigt sich, dass die Lohnspreizung bei den Frauen im 
Vergleich zu den Männern in allen Kohorten wesentlich geringer ausfällt. 
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e Bei der jüngsten Kohorte der Frauen ist von Beginn der Unterschied zwi- 
schen arithmetischem Mittel und Median der realen Bruttostundenlöhne 
verschwindend gering. Überhaupt weist diese Kohorte die geringste 
Lohnspreizung und die stabilste Struktur im Zeitablauf auf. Diese Gleich- 
heit von Median und arithmetischem Mittel stellt ein für Einkommens- 
bzw. Lohnverteilungen untypisches Charakteristikum dar. Auch hier 
könnte wieder die bei Frauen immer noch stärkere Tarifgebundenheit der 
Löhne die entscheidende Rolle spielen. Hierzu besteht jedoch weiterer 
Forschungsbedarf. 


Abbildung 5.5: Zeitliche Entwicklung der Verteilung der realen Bruttostun- 
denlöhne in Deutschland nach Kohorten, Männer, 1984-2000 
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Abbildung 5.6: Zeitliche Entwicklung der Verteilung der realen Bruttostun- 
denlöhne in Deutschland nach Kohorten, Frauen, 1984-2000 


1985 1990 1995 2000 1985 1990 1995 2000 
Jahr 


e Für Männer und Frauen gleichermaßen gilt, dass die Lohnspreizung bei 
der Kohorte 4 am geringsten und bei Kohorte 1 bzw. 2 am größten ist. Je 
älter demnach die Kohorte, desto stärker die Lohnspreizung. 
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Tabelle 5.7: Fallzahlen und durchschnittliche reale Bruttostundenlöhne in DM 
nach Jahr, Kohorte und Geschlecht 


Kohorte und Geschlecht 


Kohorte 1 Kohorte 2 Kohorte 3 Kohorte 4 
(1930-1939) (1940-1949) (1950-1959) (1960-1975) 
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5.2.3 Differenzierung nach Geschlecht und Bildungsjahren 


Differenziert man nicht zusätzlich zum Geschlecht nach Kohorten sondern nach 
der Anzahl der Bildungsjahre, zeigt sich eine weitere deutliche Heterogenität in 
der Entwicklung der Durchschnittslöhne. Abbildung 5.7 für die Männer und 
Abbildung 5.8 für die Frauen zeigen, dass sich die Durchschnittslöhne bei 9, 
10,5, 11,5 und 12 Bildungsjahren im Zeitablauf wesentlich stabiler entwickelten 
als bei 13, 15 und 18 Bildungsjahren. Die größere Streuung könnte zwar bei 13 
Bildungsjahren noch auf geringe Fallzahlen zurückzuführen sein. Bei 15 und 18 
Bildungsjahren dagegen sollten die Fallzahlen insgesamt — siehe Tabelle 5.7 — 
groß genug sein. Hier wird die größere absolute Streuung innerhalb der Gruppe 
der Männer oder Frauen mit 13 oder mehr Bildungsjahren im Vergleich zu nied- 
rigeren Bildungsjahren spürbar. Auch dies kann neben der Ausreißerempfind- 
lichkeit der Durchschnittslöhne wieder auf die größere Gebundenheit niedrigerer 
Ausbildungsabschlüsse an Tarif- bzw. Gehaltsstrukturen interpretiert werden. 


Abbildung 5.7: Zeitliche Entwicklung der durchschnittlichen realen Brutto- 
stundenlöhne in Deutschland nach der Anzahl der Bildungs- 
jahre, Männer, 1984-2000 


Durchschnittlicher realer Bruttostundenlohn 


1985 1990 1995 2000 
Jahr 
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Abbildung 5.8: Zeitliche Entwicklung der durchschnittlichen realen Brutto- 
stundenlöhne in Deutschland nach der Anzahl der Bildungs- 
jahre, Frauen, 1984-2000 


Durchschnitlicher realer Bruttostundenlohn 


1985 1990 1995 2000 


Die Differenzierung nach Bildungsjahren ist auch mit Blick auf die Schätzung 
von Obergrenzen fiir die Bildungsertragsraten interessant, da bei den im dritten 
Kapitel entwickelten Annahmen wie MTR, CMTR und MTS-MTR jeweils vor- 
ausgesetzt wird, dass die Lohnvariable monoton mit der Treatmentvariable, d.h. 
der Anzahl an Bildungsjahren, steigt. Während dies mit vier Ausnahmen (bei- 
spielsweise 11,5 - 12 Jahre 1991 und 13 - 15 Jahre 1987) für die Männer gilt, 
wird bei den Frauen öfters gegen die Monotonieannahme verstoßen. Dies sollte 
sich bei der späteren Schätzung der Obergrenzen der entsprechenden Renditen 
darin wiederspiegeln, dass diese verhältnismäßig nahe an oder sogar unter den 
entsprechenden Punktschätzungen der Renditen bei Annahme von exogener 
Treatmentselektion (ETS) liegen. 
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5.2.4 Differenzierung nach Geschlecht, Kohorten und Bildungsjahren 


In Abschnitt 4.2 wurden die Arbeiten von Steiner/Lauer (2000) und Fitzenberger 
(1999b) besprochen und dabei festgehalten, dass beide Studien deutlich gesun- 
kene Bildungsrenditen jiingerer Kohorten der Frauen feststellen. Dieses Ergeb- 
nis deutete sich bei den Auswertungen in Abschnitt 5.2.2 bereits insoweit an, als 
die Lohnverteilung mit der geringsten Spreizung bei Kohorte 4 der Frauen zu 
beobachten war. Differenziert man nun nach Kohorten und Bildungsjahren, 
sollte sich für die Kohorte 4 ergeben, dass die Unterschiede zwischen verschie- 
denen Bildungsniveaus im Vergleich zu den anderen Kohorten relativ gering 
sind. Dies bestätigt sich in Abbildung 5.9, in der die Entwicklung der durch- 
schnittlichen realen Bruttostundenlöhne für ausgewählte Bildungsjahre und Ko- 
horten dargestellt ist. Der Übersicht halber wird hierbei nur die Kohorte 3 der 
Kohorte 4, den jüngeren Geburtsjahrgängen, gegenübergestellt. Vergleicht man 
Abbildung 5.9 mit den Abbildungen 5.7 und 5.8, in denen lediglich nach Bil- 
dungsjahren differenziert wurde, so fällt auf, dass die Entwicklung der Durch- 
schnittslöhne in den einzelnen Kohorten auch bei 15 und 18 Bildungsjahren bis 
auf einzelne Ausreißer relativ stabil verläuft. In Tabelle 5.8 sind für ausgewählte 
Jahre Fallzahlen und Durchschnittslöhne nach Bildungsjahren angegeben. 


Abbildung 5.9: Zeitliche Entwicklung der durchschnittlichen realen Brutto- 
stundenlöhne in Deutschland nach ausgewählten Bildungsjah- 
ren, Geschlecht und Kohorten 


1985 1990 1995 2000 1985 1990 1995 2000 
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Es ist deutlich sichtbar, dass sowohl bei den Manner als auch bei den Frauen die 
Lohnspreizung bei der Kohorte 3 wesentlich größer ist. Bei den Männern ist dies 
auf die Bildungsjahre 15 und 18 zuriickzufiihren, bei den Frauen ebenfalls, je- 
doch nicht ganz so deutlich ausgeprägt. Dies deutet bereits an, dass die Bil- 
dungsrenditen insbesondere bei Frauen jiingerer Kohorten relativ gering ausfal- 
len werden. 


5.2.5 Zwischenfazit 


Die deskriptive Analyse der Entwicklung der Lohnstruktur brachte mehrere be- 
merkenswerte Ergebnisse. Ein Vergleich der durchschnittlichen jährlichen 
Wachstumsraten ohne Differenzierung nach Kohorten ergab mit 1,57 Prozent 
eine höhere Wachstumsrate der Frauen im Vergleich zu 1,23 Prozent für die 
Männer. Dieses Bild ändert sich aufgrund von Struktureffekten, falls nach Ko- 
horten differenziert wird. Dann weisen die Männer bis auf die zweite Kohorte 
bei allen Vergleichszeiträumen eine höhere Wachstumsrate auf. Eindeutig und 
unabhängig von der Differenzierung nach Kohorten sind die Charakteristika der 
Lohnverteilungen der Männer und Frauen. Die Lohnspreizung ist generell bei 
den Frauen weitaus geringer und nimmt auch weniger stark zu im Vergleich zu 
den Männern. Dabei ist die größte Zunahme der Lohnspreizung bei den Frauen 
im Unterschied zu den Männern im oberen Bereich der Lohnverteilung zu beo- 
bachten. Neben der geringeren Lohnspreizung ist bei den Frauen der auch wie- 
der bei allen Kohorten zu bebachtende minimale Unterschied zwischen dem 
Durchschnitt und dem Median auffällig, der auf eine im Vergleich zu den Män- 
nern sehr viel symmetrischere Verteilung der realen Bruttostundenlöhne hin- 
deutet. 


Das mit Blick auf die Analyse der Bildungsrenditen wichtigste Ergebnis ist der 
Differenzierung nach Bildungsjahren zu entnehmen. Hier ist bei den Frauen ein 
häufigerer Verstoß gegen die Monotonieannahme insofern festzustellen als bei 
den höheren Bildungsniveaus, z.B. 13, 15, 18 Bildungsjahren die Durch- 
schnittslöhne nicht immer mit der Anzahl der Bildungsjahre steigen. Das sollte 
sich bei der nichtparametrischen Schätzung der Obergrenzen darin widerspie- 
geln, dass diese entsprechend niedrig im Vergleich zu den OLS-Schätzungen 
ausfallen, vereinzelt sogar kleiner sein können. 
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Tabelle 5.8: Durchschnittliche reale Bruttostundenlöhne nach Kohorten, Jahr und Bildungszeit, Männer für ausgewählte Jahre 


Jahr und Bildungszeit 


1988 


CN 


6 


.19 


11 


.73 


13 13.5 
.73 43.53 
5 1 
76 30.52 
8 1 
32 30.12 
7 10 
.68 25.97 
3 2 
23 14 


Gesamt 


7 8.5 9 
24.12 

44 

29.52 

22 

16.94 21.58 23.91 
6 1 27 
18.67 15.46 17.50 
1 1 11 

7 2 104 

7 8.5 9 
37:32 

1 

17.39 17.36 25.86 
L 1 12 
22.76 23.82 
3 24 

4 1 37 


2000 
1.5 12 
.35 50.48 42. 
15 9 
.70 36.05 36. 
58 16 
.06 32.89 42. 
125 62 
198 87 


13 13.5 
53 44.44 
2 1 
59 34.38 
8 9 
97 35.13 
15 16 
25 26 


17 18 
53.47 

32 

28.58 45.95 
2 56 
26.07 39.43 
3 63 
29.75 

6 

5 157 

17 18 
25.24 54.48 
1 20 
40.72 49.87 
6 51 
39.00 37.92 
2 82 

9 153 


Ive 
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5.3 Empirische Evaluation nichtparametrischer Obergrenzen fiir traditio- 
nelle Renditeschätzungen 


In den folgenden beiden Abschnitten werden verschiedene nichtparametrischen 
Schätzungen der Obergrenzen von Bildungsrenditen vorgestellt und mit den 
Standardschätzungen verglichen. In Abschnitt 5.3.1 werden die wichtigsten 
nichtparametrischen Obergrenzen für ausgewählte Bildungsniveaus für Männer 
und Frauen betrachtet und mit den Schätzungen der Standardeinkommensfunk- 
tion verglichen. Es wird sich zeigen, dass allein die Annahme von MTS-MTR 
fast durchweg Obergrenzen für Bildungsrenditen liefert, die in einem ökono- 
misch sinnvollen Rahmen bleiben. Des weiteren wird sich zeigen, dass nicht nur 
die Obergrenzen sondern auch die ETS-Punktschätzungen der Renditen in Ab- 
hängigkeit davon, welche Bildungsjahre miteinander verglichen werden, stark 
schwanken. Dies wirft Zweifel an der Angemessenheit der Standardlohnfunk- 
tion bzw. der Verwendung einer einzigen Bildungsrendite zur Beurteilung der 
Entwicklung der Lohnstruktur auf. Abschnitt 5.3.2 vergleicht die nichtpara- 
metrischen Instrumentalvariablenschätzungen bei Annahme von MIV-MTR mit 
traditionellen IV-Schätzungen. Auch hier ergeben sich deutliche Unterschiede 
der MIV-MTR-Obergrenzen in Abhängigkeit der miteinander verglichenen Bil- 
dungsjahre, die traditionelle Instrumentenschätzungen in Frage stellen und ande- 
rerseits die Verwendung so genannter LATE-Schätzungen bestärkt. 


5.3.1 Obergrenzen für die Standardeinkommensfunktion 


In Tabelle 5.9 werden die auf der Basis verschiedener Annahmen nichtpara- 
metrisch geschätzten Obergrenzen beispielhaft für zwei Jahre, 1988 und 1998, 
für verschiedene Kombinationen von Bildungsjahren nur für Männer dargestellt, 
da sich durch die Betrachtung der Obergrenzen für Frauen und für die übrigen 
Jahre an dem Vergleich der Obergrenzen inhaltlich nichts ändert. 


Wie schon theoretisch in Kapitel 3 beim Vergleich der Annahmen abgeleitet, 
sind die Obergrenzen im Worst-Case-Fall am höchsten, mit teilweise weit über 
100% so hoch, dass aus ökonomischer Perspektive von keiner sinnvollen Ober- 
grenze gesprochen werden kann. Die nichtparametrischen Obergrenzen bei An- 
nahme von MTR, CMTR und MTS stellen demgegenüber eine deutliche Ver- 
besserung dar. Mit größtenteils über dreißig Prozent liegen jedoch auch sie im- 
mer noch deutlich über den meisten geschätzten Bildungsrenditen, selbst bei 
Verwendung von Instrumentalvariablen. Dabei muss bei den Annahmen von 
MTS und MTS-MTR beachtet werden, dass sich bei Annahme von MTS in 
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K; -P(z > t,|w)+ Ely|w,z = t, |-P(z < t.|w) 


3.181 
TT a pb nll- Siss =n] Peth) 


und bei Annahme von MTS-MTR in 


Ay, it, = | IE |w,Z=t,)-E(y|w,z= ol, P(z = u) 


u<tj 


(3.216) + [Ely|w,z = As Elle, = t,)]: P(t, ens t,|w) 


| DIE |w,z =u) - E(y|w,z=t,)]-P(z= di 


u>ty 


für die Obergrenze der Rendite mit t; = tmin und t; = Les die ETS-Punktschät- 


zung Ely|w,z = trex |- Ehe, = t n | ergibt, siehe Tabelle 5.9, Spalte ETS und 
MTS-MTR für t; =9 und t, =18. Je weiter die betrachteten Bildungsjahre tı 


und t, auseinanderliegen, umso näher liegt die Obergrenze tendenziell an der 
ETS-Punktschätzung und desto kleiner wird tendenziell die Obergrenze bei 
MTS und MTS-MTR. 


Auch die Obergrenzen, geschätzt unter Verwendung des Roy-Modells (Ab- 
schnitt 3.2.6) mit einem Diskontsatz r von 5 Prozent und dem Parameter a ent- 
sprechend des Abstandes der jeweils betrachteten Bildungsjahre, sind nur in 
Einzelfällen unter 30 Prozent.” Bei einem höheren Diskontsatz, z.B. 10 Prozent, 
steigen die Obergrenzen in der Regel um etwa 2-4 Prozentpunkte. Bei einem 
niedrigeren Abzinsungsfaktor sinken sie entsprechend. 


Fast durchgehend unter 20%, und damit immerhin im Rahmen vieler Instru- 
mentalvariablenschätzungen, liegt die Obergrenze auf der Basis der Kombina- 


° Ginther (2000) erhält mit Daten des National Longitudinal Survey of the Youth (NLSY) 
deutlich höhere Grenzen. Ihre Studie unterscheidet sich jedoch in einigen Punkten. Sie 
schätzt zwei binäre Treatmenteffekte, Bildungsjahre größer als 12 und Bildungsjahre 
größer als 15, beschränkt ihre Stichprobe auf 29 bis 37 jährige vollzeiterwerbstätige 
Männer und trimmt die Stichprobe, da Löhne über 100.000$ zensiert sind. Als Parameter a 
verwendet sie in beiden Fällen acht Jahre, um auch hier eine Obergrenze zu verwenden. 
Aus demselben Grund verwendet sie Abzinsungsfaktoren von 5 und 10 Prozent. Aus der 
Darstellung der Roy-Obergrenzen in Abschnitt 3.2.6 ist klar ersichtlich, dass aus größeren 
Werten für a und r ceteris paribus größere Obergrenzen resultieren. 
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tion von MTR und MTS. Einzige Ausnahmen mit Renditen bis zu 37 Prozent 
stellen in Tabelle 5.9 die Fälle dar, in denen t; und t nur ein halbes Jahr ausei- 
nanderliegen.° Dafür gibt es neben möglichen ökonomischen Gründen folgende 
theoretische Erklärung. Mit der im vorliegenden Fall verwendeten Kodierung 
folgt aus einem Abstand von einem halben Jahr zwischen t, und t dass es sich 
um zwei aufeinanderfolgende Bildungsjahreinheiten handelt. 


Für diesen Fall vereinfacht sich bei der Punktschätzung der Bildungsrendite in 
der Darstellung (3.216) P(t, S2< Ga) zu P(z=t,)+P(z=t,). Je größer aber 
dieser Term, umso näher ist man wie im Fall der Annahmen von MTS und 
MTS-MTR an der ETS-Punktschätzung, da in (3.216) der Teil 
[Elylw,z = t, ]- E(ylw,z = t,)]- P(t, <z<t,|w) für P(t, <z<t,|w)=1 der ETS- 
Punktschätzung entspricht. Da dieser Anteil für aufeinanderfolgende Bildungs- 


jahre t; und t, jedoch vergleichsweise gering ist, sind die Renditen tendenziell 
größer. 


Att, = | DIE(y | w,z = ty) - E(y | w,z = u)]- P(z = di 


u<t, 


(3.216) + [Elylw,z = t, |- E(y|w,z =t,)]- P(t, <z < t,|w) 


‘| DIE | w,z =u) - E(y|w,z = t,)] P(z = eil 


u>t, 


Allein daraus sollten jedoch keine derartig großen Unterschiede resultieren. Ne- 
ben den schon im vorigen Abschnitt bei der Differenzierung nach Bildungsjah- 
ren formulierten Zweifeln an der Monotonie des Durchschnittslohnsatzes im ge- 
samten Bereich der Bildungsvariablen deuten die sehr unterschiedlich hohen 
jährlichen Renditen der ETS-Punktschätzungen darauf hin, dass auch die bei der 
Schätzung der Standardeinkommensfunktion meistens unterstellte Linearität der 
Einkommensfunktion in Frage zu stellen ist. Dies kann daran liegen, dass ge- 
wisse Sprungstellen im Ausbildungssystem begründet sind, oder daran, dass es 
unter Umständen sehr problematisch ist, verschiedene Bildungsabschlüsse in 
Bildungsjahre umzurechnen. Die Verwendung von generierten Bildungsjahren 


é Dieselbe Argumentation gilt natürlich auch für aufeinanderfolgende Bildungseinheiten mit 
einem Jahr Differenz. Da jedoch im Bereich zwischen 10 und 14,5 Bildungsjahren, in dem 
die höchsten Renditen zu verzeichnen sind, immer ein halbes Jahr Differenz codiert ist, 
sind die Renditen hier größer als zwischen den aufeinanderfolgenden Bildungseinheiten 17 
und 18 Jahren. 
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wird mit ähnlichen Argumenten ja auch schon von Psacharopoulos selbst sowie 
anderen Autoren kritisiert und stattdessen die Verwendung von Dummyvariab- 
len fiir die Bildungsabschliisse empfohlen. ’ 


Tabelle 5.9: Ausgewählte Obergrenzen für Bildungsrenditen in Prozent, 
Männer, 1988 und 1998, im Vergleich mit OLS- und ETS-Punkt- 
schätzungen 


OLS 


WORST | MTR | CMTR MTS-MTR 


52,8 | 65, 
58,4 


ADH“ Hon o 
W Wa Ww 


; 50,7 
51,7 


i 43,7 
25,2 46,8 


=|= 
O (öolto © 
O œj œ 
œ œo © 


= 
GA WI®W LA 


= 
co 
CO 
CO 


—_ ` wh, 
oO CH 
OO CO 
CO CO 
NENGO 
olo o 
A DA DA omaan DA OD 
WwW 


222,5 | 177,2 65,6 
240,9 | 185,5 75,9 
159,0 | 133,3 
167,0 | 136,4 
53,4 47,9 14,1 
56,7 50,6 13,9 


TET 


505,3 | 322,5 
547,2 | 335,3 
530,9 | 329,7 
547,3 | 318,9 


TE 


3 

3 

. 3 
3 

16,2 3 
13,0 3 
7,9 9,3 
5,8 3 
FIF 
3 

6, 3 
3 

3 


an 
D WI N 
ag 


1998| 11,5 | 18 4,2 5,3 22,0 
In Tabelle 5.10 werden für das Jahr 1995 ausgewählte CMTR-Obergrenzen zu- 
sammen mit den Punktschätzungen der Quantilregressionen berichtet, da für die 


Quantile der Bildungsrenditen bislang noch keine MTS-MTR-Obergrenzen ent- 
wickelt wurden und die Worst-Case-, MTS- und MTR-Obergrenzen für die 


7 Vel. Psacharopoulos (1994). 
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Quantile größenordnungsmäßig wie im Fall der durchschnittlichen Rendite 
deutlich über 50 Prozent liegen. 


Tabelle 5.10: Quantilregressionen und CMTR-Obergrenzen für Quartile und 
Median der Bildungsrenditen in Prozent, 1995, Männer 


QREG QREG QREG 
1. Quartil | Median | 3. Quartil 


Die Obergrenzen sind im Vergleich zu den MTS-MTR-Obergrenzen für die 
durchschnittliche Rendite zwar durchweg mit ca. 30 Prozent dreimal so hoch, 
dafür im Zeitablauf sehr stabil. Dies wird auch durch Bootstrap-Konfidenzinter- 
valle mit 500 Wiederholungen bestätigt. Ein für alle Kombinationen von Bil- 
dungsjahren gültiges Phänomen ist das konstruktionsbedingte Ansteigen der 
Obergrenzen der Renditen bezüglich der Quartile in Tabelle 5.10, die sich auch 
in der Ordnung der Renditen der Quantilregression widerspiegelt. Da die Be- 
trachtung der Obergrenzen für die Quantile aufgrund CMTR in den anderen Jah- 
ren und bei den Frauen keine weiteren Erkenntnisse liefert, wird auf eine aus- 
führliche Darstellung dieser Grenzen verzichtet. 


Im nächsten Abschnitt werden nichtparametrische Obergrenzen unter Verwen- 
dung monotoner Instrumentalvariablen, kombiniert mit monotonen Response- 
funktionen (MIV-MTR), geschätzt und mit gewöhnlichen Instrumentenschät- 
zern verglichen. Es wird sich zeigen, dass die Anzahl der Bildungsjahre des 
Vaters als Instrument höhere Obergrenzen liefert als wenn die Treatmentvari- 
able selbst als Instrument verwendet. Dies entspricht, wie in Abschnitt 3.2.5.3 
gezeigt wurde, der Annahme von MTS-MTR. 


5.3.2 Obergrenzen für Instrumentalvariablenschätzungen 


Instrumentschätzungen der Standardlohnfunktion, die Bildungsrenditen von 

teilweise weit über 10 Prozent ergaben, wurden einige Zeit als Beleg dafür ge- 

wertet, dass die Anzahl der Bildungsjahre keineswegs exogen ist und daher 

OLS-Schätzungen der Standardlohnfunktion die Renditen systematisch deutlich 

unterschätzen. In diesem Abschnitt werden Ergebnisse von OLS- und IV-Reg- 

ressionen vorgestellt und mit Schätzungen der MIV-MTR-Obergrenzen vergli- 
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chen. Als Instrument fiir die Anzahl der Bildungsjahre einer Person wird dabei 
entweder die Anzahl der Bildungsjahre des Vaters oder der Mutter verwendet. 


In den Abbildungen 5.10 und 5.11 sind die IV-Schätzungen und die entspre- 
chenden OLS-Schätzungen für Manner bzw. Frauen dargestellt.’ Es zeigt sich 
bei den Schätzungen für die Männer, dass die IV-Schätzungen mit der Anzahl 
der Bildungsjahre der Mutter als Instrument in der Mehrzahl der Fälle nicht über 
den OLS-Schätzungen der Bildungsrenditen liegen. Die IV-Schätzungen der 
Renditen mit dem Instrument, Anzahl der Bildungsjahre des Vaters, sind zwar 
mit Ausnahme der beiden letzten Jahr höher als die OLS-Schätzungen, jedoch 
nur teilweise signifikant höher, z.B. 1985-1987, und selbst dann beträgt der Un- 
terschied meist nur etwa einen Prozentpunkt. Es fällt schwer, eine Erklärung für 
dieses Ergebnis zu geben, das bereits von Lauer/Steiner (2001) berichtet wird. 
Auch sie geben keine Erklärung, warum in Deutschland der Unterschied zwi- 
schen den IV- und OLS-Schätzungen so gering ist. 


Abbildung 5.10: Zeitliche Entwicklung der OLS- und IV-Schätzungen der Bil- 
dungsrenditen, Männer, 1984-2000 
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® Es wurden auch IV-Schätzungen mit der Bildung des Vaters und der Mutter als Instrument 
durchgeführt. Diese Schätzungen unterscheiden sich nur geringfügig von den hier mit der 
Bildung des Vaters als alleinigem Instrument durchgeführten. Die Ergebnisse der OLS- 
Regressionen unterscheiden sich ebenfalls, allerdings nur minimal, von denen des vorigen 
Abschnittes, da nur die Beobachtungen verwendet wurden, für die auch Beobachtungen 
der Instrumente vorhanden waren. 
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Die Schätzungen für die Frauen schwanken stark. Ein möglicher Grund dafür 
könnte eine geringere Korrelation des Instruments mit der Bildungsvariablen 
sein. In Tabelle 5.11 sind deshalb die partiellen Korrelationskoeffizienten zwi- 
schen der Anzahl an Bildungsjahren und den Instrumenten angegeben. Da diese 
Korrelationskoeffizienten bei den Männern im Zeitablauf sehr stabil blieben, ist 
hier wegen stellvertretend für die übrigen Jahre nur der Wert des Jahres 2000 
angegeben. Bei den Frauen zeigt sich ein leicht anderes Bild. Bis 1992 war der 
partielle Korrelationskoeffizient mit dem Instrument Bildung der Mutter deut- 
lich geringer, stieg aber fast stetig von 1993 bis 2000 und war 2000 mit 0,27 
deutlich höher als 1992 mit 0,1. Es ist allerdings fraglich, ob dies allein die Ur- 
sache für die teils extremen Schwankungen sein kann. Selektionseffekte dürften 
dabei die Hauptursache darstellen. Hier zeigt sich weiterer Forschungsbedarf. 


Tabelle 5.11: Partielle Korrelationskoeffizienten zwischen der Anzahl an Bil- 
dungsjahren und den Instrumenten 


1987 1989 1992 1996 2000 2000 


Abbildung 5.11: Zeitliche Entwicklung der OLS- und IV-Schätzungen der Bil- 
dungsrenditen, Frauen, 1984-2000 
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In den Abbildungen 5.12a und 5.12b sind Schätzungen der MIV-MTR-Ober- 
grenzen für Männer mit der Anzahl an Bildungsjahren des Vaters als Instrument 
dargestellt. 


Abbildung 5.12a: Zeitliche Entwicklung der MIV-MTR-Obergrenzen, Männer, 
1984-2000 
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Abbildung 5.12b: Zeitliche Entwicklung der MIV-MTR-Obergrenzen, Männer, 
1984-2000 
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Die Obergrenzen mit der Anzahl an Bildungsjahren der Mutter als Instrument 
liegen durchweg über diesen Obergrenzen und werden daher nicht abgebildet. 
Es zeigt sich durchgehend, dass die Obergrenzen umso niedriger sind je größer 
der Unterschied in Bildungsjahreinheiten ist. Aber selbst die niedrigsten Ober- 
grenzen sind bis auf wenige Ausnahmen durchweg dreimal so hoch wie die ent- 
sprechenden OLS- und IV-Schätzungen und je nach gewähltem Vergleich steigt 
dieses Verhältnis bis auf das 10-fache an. 


Dasselbe Bild zeigt sich mit Ausnahme des Vergleichs von 12 und 18 Bil- 
dungsjahren bei den Frauen. Aber auch hier sind die Obergrenzen mindestens 
doppelt so hoch, so dass als Fazit festgehalten werden kann, dass mit der An- 
nahme von MIV-MTR keine mit der Annahme von MTS-MTR vergleichbaren 
Grenzen angegeben werden können. 


Abbildung 5.13a: Zeitliche Entwicklung der MIV-MTR-Obergrenzen, Frauen, 
1984-2000 
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Abbildung 5.13b: Zeitliche Entwicklung der MIV-MTR-Obergrenzen, Frauen, 
1984-2000 
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Nachdem nun auch empirisch eindeutig die Überlegenheit der Annahme von 
MTS-MTR zur Bestimmung von Obergrenzen gezeigt werden konnte, werden 
nur die nichtparametrischen Obergrenzen dieser Annahme im letzten Abschnitt 
5.4 neben den traditionellen Verfahren zur Analyse der Lohnstrukturen verwen- 
det. 
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5.4 Empirische Evaluation charakteristischer Strukturmerkmale der Ent- 
wicklung der Bildungsrenditen in Deutschland mit Hilfe nichtpara- 
metrisch geschätzter Obergrenzen 


In den folgenden Abschnitten werden traditionelle Verfahren zusammen mit den 
nichtparametrischen Verfahren zur Schätzung der Obergrenzen auf die Untersu- 
chung der beiden im vierten Kapitel formulierten mikroökonomischen stilisier- 
ten Fakten sowie einer kohortenspezifischen Analyse der Entwicklung der Ren- 
diten angewendet. Die nichtparametrisch geschätzten Obergrenzen bei Annahme 
von MTS-MTR werden abschließend auf ihre Eignung zur Messung der Lohn- 
diskriminierung im Vergleich mit dem traditionellen Oaxaca/Blinder-Ansatz 
überprüft. 


5.4.1 Zur These im Zeitablauf fallender Bildungsrenditen 


Da die Annahme von MTS-MTR die aus ökonomischer Sicht bei weitem realis- 
tischsten Obergrenzen liefert, konzentriert sich die Untersuchung des Verlaufs 
der Bildungsrenditen und deren nichtparametrisch geschätzten Obergrenzen im 
Folgenden auf diese Annahme. In Abbildung 5.14 sind für die Vergleiche der 
am häufigsten auftretenden Bildungsjahre nichtparametrisch geschätzte Ober- 
grenzen bei Annahme von MTS-MTR zusammen mit OLS-Schätzungen der 
Bildungsrenditen für Männer dargestellt. 


Abbildung 5.14: Zeitliche Entwicklung ausgewählter nichtparametrischer Ober- 
grenzen der Bildungsrenditen bei Annahme von MTS-MTR im 
Vergleich mit OLS, Männer, 1984-2000 
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In den Abbildungen 5.14 und 5.15 sind für die Frauen und Männer OLS- und 
Quantilregressionen zusätzlich zu den nichtparametrischen Grenzen in Abbil- 
dung 5. abgebildet. Es zeigt sich, dass die Bildungsrenditen der Frauen von 1984 
bis 1992, 1986 ausgenommen, stetig und insgesamt um immerhin fast 1,5 Pro- 
zentpunkte gefallen sind. Seit 1992 ist dagegen kein eindeutiger Trend mehr zu 
erkennen. Im Jahr 2000 liegt die Bildungsrendite sogar wieder leicht über dem 
Niveau von 1984. Bei den Männern ist ein ähnlicher Verlauf von 1988 bis 1994 
zu sehen. In diesem Zeitraum sanken die Bildungsrenditen, allerdings bei größe- 
ren Schwankungen im Vergleich mit den Frauen, von leicht über 7,5 Prozent auf 
6,5 Prozent. Im Jahr 2000 liegen sie nach zwischenzeitlichen Schwankungen 
2000 wieder bei knapp 7,5 Prozent. Die größere Lohnspreizung der Männer 
zeigt sich beim Vergleich der Quantilregressionen sehr deutlich. Während die 
Renditeschätzungen mit OLS- und Medianregression sehr eng beieinander lie- 
gen, sind die Renditeschätzungen des dritten Quartils mit nur einer Ausnahme 
1990 systematisch höher und die des ersten Quartils systematisch niedriger. 


Abbildung 5.15: Zeitliche Entwicklung der Bildungsrenditen, OLS- und 
Quantilregressionen, Männer, 1984-2000 
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Bei den Frauen zeigt sich ein leicht abweichendes Bild. Tendenziell liegen zwar 
auch hier die Schätzungen der OLS- und Medianregressionen eng beieinander, 
die Schätzungen für das erste Quartil weisen jedoch häufig die höchsten und die 
Schätzungen für das dritte Quartil die niedrigsten Renditen auf. 


Steffen Wirth - 978-3-631-75476-4 
Downloaded from PubFactory at 01/11/2019 04:32:44AM 
via free access 


254 


Abbildung 5.16: Zeitliche Entwicklung der Bildungsrenditen, OLS- und Quan- 
tilregressionen, Frauen, 1984-2000 
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Es bleibt festzuhalten, dass weder mit den nichtparametrischen noch mit den 
traditionellen Verfahren ein stabiler Trend zu sinkenden Bildungsrenditen er- 
kennbar ist. 


Zusätzlich zu den Punktschätzungen der Obergrenzen wurden Bootstrap-Konfi- 
denzintervalle geschätzt. Mit Ausnahme der in Tabelle 5.12 aufgeführten Fälle 
sind alle Obergrenzen für die Jahre 1988 und 1998 signifikant von Null ver- 
schieden. Ursache für die Nichtsignifikanz der Obergrenzen in den angeführten 
vier Fällen ist, dass der durchschnittliche reale Bruttostundenlohn bei 14,5 Bil- 
dungsjahren sehr viel geringer ist als bei 11,5, 12 und 13 Jahren, so dass es auf- 
grund des deutlichen VerstoBes gegen die Monotonieannahme zum einen zu 
kleineren Obergrenzen selbst im Vergleich zur OLS-Punktschätzung kommt, 
zum anderen die Streuung der geschätzten Rendite auch aufgrund der kleinen 
Fallzahlen bei 14,5 Bildungsjahren größer ist. Da dies für die gesamte Periode 
1984-2000 gilt, werden nur Beispiele für 1988 und 1998 angeführt. 


Tabelle 5.12: Beispiele für nicht signifikant von Null verschiedene Obergren- 
zen der Bildungsrenditen bei Annahme von MTS-MTR, 1988 
und 1998, Männer 
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In Ergänzung zu Tabelle 5.12 sind in Tabelle 5.13 nochmals Beispiele für 
durchschnittliche Bildungsrenditen bei Verwendung von MTS-MTR angeführt, 
die höchstens 10 Prozent betragen. Im Fall der jährlichen Rendite von 10,5 auf 
18 Bildungsjahren sieht man sogar, dass bei Verletzung der Monotonieannahme 
die ETS-Punktschätzung über der MTS-MTR-Obergrenze liegen kann. 


Tabelle 5.13: Obergrenzen der Bildungsrenditen bei Annahme von MTS-MTR, 
die höchstens 10 Prozent betragen, im Vergleich mit ETS- und 
OLS-Schätzungen 


MTS-MTR 
Bä. 


8,3 
59 | 


Angesichts der Abbildung 5.14 liegt die Vermutung nahe, dass zwischen den 
OLS-Schätzungen der Bildungsrenditen und den nichtparametrisch geschätzten 
Obergrenzen ein systematischer Zusammenhag besteht. In Tabelle 5.14 sind 
deshalb die empirischen Korrelationskoeffizienten für die in Abbildung 5.10 
verwendeten Renditen angegeben. Bis auf den Vergleich zwischen 9 und 11,5 
Bildungsjahren ist die positive Korrelation mit mindestens 0,69 als hoch zu 
bezeichnen. 


Tabelle 5.14: Korrelationskoeffizienten zwischen den OLS- und MTS-MTR- 


Schätzungen, Männer, 1984-2000 


9-11,5 9-15 9-18 11,5-15 11,5-18 
Bildungsjahre | Bildungsjahre | Bildungsjahre | Bildungsjahre | Bildungsjahre 


Bevor im nächsten Abschnitt die Entwicklung der Kohorten untersucht wird, 
bleibt zum einen festzuhalten, dass ein systematischer Zusammenhang zwischen 
den OLS-Punktschätzungen und den MTS-MTR-Obergrenzen besteht. Die 
Bandbreite des Korrelationskoeffizienten von 0,32 bis 0,90 deutet aber an, dass 
abhängig von den miteinander verglichenen Bildungsjahren, mehr oder weniger 
stark abweichende Entwicklungen möglich sind. Zum anderen liegen die MTS- 
MTR-Obergrenzen für die durchschnittliche jährliche Rendite in vielen Fällen 
deutlich unter Instrumentalvariablenschätzungen und in Einzelfällen — siehe 
Tabelle 5.13 — aufgrund des nicht in jedem Falle monotonen Verlaufs der 
Durchschnittslöhne sogar unter den ETS-Punktschätzungen. 
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5.4.2 Zur These höherer Bildungsrenditen für Frauen 


Bei der deskriptiven Analyse der Lohnverteilungen, differenziert nach Ge- 
schlecht und Bildungsjahren, in Abschnitt 5.2.3 wurde bereits vermutet, dass die 
Bildungsrenditen der vollzeiterwerbstätigen Frauen niedriger als die der Männer 
sein müssten. Diese Vermutung wird durch die in Abbildung 5.17 dargestellte 
Entwicklung der mit OLS- und Medianregressionen geschätzten Bildungsrendi- 
ten eindeutig bestätigt. An dieser Aussage ändert auch die Betrachtung der 
nichtparametrisch geschätzten Obergrenzen nichts, auf die im nächsten Ab- 
schnitt bei der Kohortenanalyse noch näher eingegangen wird und die deshalb 
hier nicht abgebildet werden. 


Abbildung 5.17: Zeitliche Entwicklung der Bildungsrenditen, OLS- und 
Medianregressionen, Frauen und Männer, 1984-2000 
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Im nachsten Abschnitt wird die Entwicklung der Bildungsrenditen differenziert 
nach Kohorten untersucht. Auch hier sollte sich die bereits in Abschnitt 5.2.4 
geäußerte Vermutung bestätigen, dass die niedrigsten Bildungsrenditen bei der 
jüngsten Kohorte der Frauen zu beobachten sein sollte. Bei dieser Kohorten- 
analyse werden auch wieder nichtparametrisch geschätzte Obergrenzen vorge- 
stellt. 
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5.4.3 Zur These drastisch gesunkener Bildungsrenditen von Frauen 
jüngerer Kohorten 


Beispielhaft für die in Tabelle 5.15 aufgeführte Entwicklung der MTS-MTR- 
und OLS-Grenzen der vier Kohorten, sind in den Abbildungen 5.18a und 5.18b 
die Verläufe der Renditen für 10,5-15 und 10,5-18 Bildungsjahre dargestellt. 


Abbildung 5.18a: Zeitliche Entwicklung nichtparametrischer Obergrenzen der 
Bildungsrenditen bei Annahme von MTS-MTR im 
Vergleich mit OLS nach Kohorten, Männer, 1984-2000 
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An den in den vorangegangenen Abschnitten beobachteten, konstruktionsbe- 
dingten Phänomenen in Bezug auf die Obergrenzen kann sich auch durch Diffe- 
renzierung nach Kohorten nichts ändern. Daher ist auch hier zu sehen, dass die 
Obergrenzen für 10,5-18 Bildungsjahre wesentlich geringer und näher bei den 
OLS-Renditen liegen. Damit ist auch der nahezu parallele Verlauf in Abbildung 
5.18b der MTS-MTR-Obergrenzen und der OLS-Renditen zu erklären. Klar 
bestätigt im Hinblick auf die Rangordnung der Renditen innerhalb der Kohorten 
wird das Ergebnis von Steiner/Lauer (2000), dass die jüngeren Kohorten 
schlechter abschneiden. Allerdings ist hier seit 1996 eine relative Verbesserung 
der Kohorte 4 und 3 gegenüber der Kohorte 2 zu erkennnen, die in Steiner/Lauer 
(2000) noch nicht festzustellen war, da sie nur Daten bis 1997 verwendet haben. 
Diese Aussage ist aber insofern zu relativieren als sie auf der einfachst mögli- 
chen Spezifikation der Mincer’schen Lohnfunktion beruht. 
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Abbildung 5.18b: Zeitliche Entwicklung nichtparametrischer Obergrenzen der 
Bildungsrenditen bei Annahme von MTS-MTR im Vergleich 
mit OLS nach Kohorten, Männer, 1984-2000 
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Abbildung 5.19a: Zeitliche Entwicklung nichtparametrischer Obergrenzen der 
Bildungsrenditen bei Annahme von MTS-MTR im Ver- 
gleich mit OLS nach Kohorten, Frauen, 1984-2000 
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Abbildung 5.19b: Zeitliche Entwicklung nichtparametrischer Obergrenzen der 
Bildungsrenditen bei Annahme von MTS-MTR im Ver- 
gleich mit OLS nach Kohorten, Frauen, 1984-2000 
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Abbildung 5.20: Zeitliche Entwicklung der Bildungsrenditen, OLS-Regression, 
Frauen und Männer nach Kohorten, 1984-2000 
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Abbildung 5.21: Zeitliche Entwicklung der Bildungsrenditen, Medianregres- 
sion, Frauen und Manner nach Kohorten, 1984-2000 


Medianregression 


15,00 
14,00 - 
13,00 
12,00 —e— 050 K2 M 
S 10,00 
S — X- - Q50 K3F | 
9,00 — -X — Q50 K4 M 


8,00 
7,00 - 
6,00 


5,00 r : 
1990 1992 1994 1996 1998 2000 


Jahr 


—@— Q50 K4 F 


Abbildung 5.22: Zeitliche Entwicklung der Bildungsrenditen, Quantilregres- 
sion für das 1. Quartil, Frauen und Männer nach Kohorten, 
1984-2000 
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Abbildung 5.23: Zeitliche Entwicklung der Bildungsrenditen, Quantilregression 
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5.4.4 Zur nichtparametrischen Messung der Lohndiskriminierung von Frauen 


AbschlieBend wird der in Abschnitt 3.4.3 vorgeschlagene Ansatz zur Messung 
der Lohndiskriminierung mit nichtparametrisch geschätzten Obergrenzen einem 
empirischen Test unterzogen. In Tabelle 5.16 sind die Ergebnisse dieser Schat- 
zungen beispielhaft dargestellt. Dabei wurde fiir den Ansatz von Oaxaca/Blinder 
die in den empirischen Studien üblicherweise gewählte Variante a aus Abschnitt 
3.4.1 verwendet. 


(a) Im —Xy = (BT -BY)+S, Br -B7 )+p™-G,, -3,) 


Als nichtparametrischer Ansatz wurde die Annahme von MTS-MTR ausge- 
wählt, die sich in der empirischen Anwendung gegenüber den anderen Anwen- 
dungen als überlegen herausgestellt hat. Dies ergibt mit der Zerlegung in 


(3.305): 


(3.305) 


RER = Cees 
ty te ty,t2 
= ( O,MTS-MTR _ pS) eeng SKS) 
= mt, w,t2 mt, ~ “w,ty 
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Tabelle 5.15: MTS-MTR-Obergrenzen und OLS-Schätzungen, nach Kohorten 
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Tabelle 5.15 fortgesetzt: 
Bä |85| 53 | 
Bä Lë 


Weiter wurden in Tabelle 5.16 stellvertretend fiir den Gesamtzeitraum die vier 
Jahre 1985, 1990, 1995 und 2000 ausgewählt, da die Betrachtung der übrigen 
Jahre nichts an den Schlussfolgerungen ändert. Während beim Oaxaca/Blinder- 
Ansatz zwischen 1,6 und 6,2 Prozent der Lohndifferenz durch die Bildungsvari- 
able erklärt werden können, schwanken die nichtparametrischen Schätzungen 
sehr stark und sind in der Regel hochgradig insignifikant.’ Nicht selten ergeben 
sich dabei sogar negative Werte, z.B. regelmäßig aber insignifikant bei 14,5 Bil- 
dungsjahren, die inhaltlich einen entsprechend geschätzten Lohnvorteil der 
Frauen andeuten. Die Ergebnisse dieser ersten empirischen Prüfung lassen die 
vorgeschlagene nichtparametrische Messung der Lohndiskriminierung wenig 
erfolgsversprechend erscheinen. Es wäre jedoch zu früh, die Forschungsbe- 
mühungen hier abzubrechen. Die Einbeziehung weiterer Kontrollvariablen wie 
in Ginther (2000) mag hier einen Fortschritt ermöglichen.'” 


Tabelle 5.16: Erklärung der Lohndifferenz zwischen Frauen und Männern in 
Prozent, MTS-MTR und Oaxaca/Blinder 


Bildungs- | Oaxaca/ Bildungs- | Oaxaca/ 
| 9| 9 | 
0 


206.9 | 


15 
DC 


? Es wurden jeweils Bootstrap-Konfidenzintervalle mit 500 Replikationen geschätzt. 
10 Vgl. Ginther (2000), S. 108f. 
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6. Schlussbemerkungen 


Die vorliegende Studie stellt erstmals ausführlich die nichtparametrische Schät- 
zung von Treatmenteffekten und hier speziell von Bildungsrenditen theoretisch 
und empirisch dar. Ausgangspunkt der Kritik an den traditionellen Verfahren 
zur Schätzung von Bildungsrenditen bildet dabei die implizit bei der Schätzung 
der Standardlohnfunktion verwendete Annahme exogener Treatmentselektion 
(ETS). Inhaltlich bedeutet dies, dass sämtliche Standardverfahren, wie z.B. 
OLS- oder Quantilregressionen, unterstellen, dass die Rendite eines zusätzlichen 
Bildungsjahres unabhängig von der betrachteten Zahl an Bildungsjahren ist. 
Nicht zuletzt die Vielzahl empirischer Studien, die auf der Standardlohnfunktion 
basieren und dabei Vergleiche von Bildungsrenditen ermöglichen, zeigten je- 
doch, dass dieses traditionelle Konzept durchaus als erfolgreiches arbeitsmarkt- 
theoretisches Modell bezeichnet werden kann. Dennoch wurde bereits seit der 
Einführung der Mincer’schen Standardlohnfunktion für die Operationalisierung 
der Bildungsvariablen neben der Anzahl an Bildungsjahren auch die Verwen- 
dung von Dummyvariablen für Bildungsabschlüsse vorgeschlagen, da dies eine 
differenziertere Schätzung der Renditen erlaubt. Studien, die Dummyvariablen 
verwenden, zeigen im Ergebnis dann auch, dass es tatsächlich große Unter- 
schiede in den jährlichen Bildungsrenditen gibt. Ein Grund für die Bevorzugung 
der Anzahl der Bildungsjahre als Regressor in der Mehrzahl der Studien dürfte 
neben der noch einfacheren Interpretierbarkeit und Darstellung das scheinbar 
geringere Problem der Vergleichbarkeit mit Studien anderer Länder sein. 
Scheinbar deshalb, weil die bessere Vergleichbarkeit nur durch eine vorge- 
schaltete Umrechnung der Bildungsabschlüsse in Bildungsjahre erreicht wird. 
Unterschiede in den internationalen Bildungssystemen werden so verschleiert. 
Es gibt also gute Gründe, anstelle oder neben der Anzahl der Bildungsjahre 
Dummyvariablen für die Bildungsabschlüsse zu verwenden. 


Allerdings implizieren auch die Schätzungen mit Dummyvariablen exogene 
Treatmentselektion. Im dritten Kapitel, dem theoretischen Teil der Arbeit, wur- 
den deshalb zunächst ausführlich die Grundlagen der Identifikationsanalyse dar- 
gestellt, um die Bedeutung der Annahme exogener Treatmentselektion für die 
Identifikation der Treatmenteffekte allgemein und der Identifikation der Bil- 
dungsrenditen im Speziellen herauszuarbeiten. Es wird gezeigt, dass mit der 
Annahme exogener Treatmentselektion das Problem der kontrafaktischen Situa- 
tion formal sehr elegant, aber mit der ökonomisch unplausiblen Konstruktion 
einer Vergleichssituation gelöst wird. Die daran anschließend eingeführten 
nichtparametrischen Annahmen verzichten allesamt auf die Annahme von ETS. 
Als Referenzpunkt zur Beurteilung der Identifikationskraft dieser nichtpara- 
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metrischen Annahmen dient das Worst-Case-Szenario, in dem auf jede An- 
nahme bezüglich der nicht identifizierten Größen verzichtet wird. Dies führt 
dazu, dass die Bildungsrendite nicht mehr identifizierbar ist und nur noch Punkt- 
schätzungen für ihre Unter- bzw. Obergrenze angegeben werden können. Schritt 
für Schritt werden dann Annahmen eingeführt, die weit weniger restriktiv und 
ökonomisch plausibler erscheinen als die Annahme exogener Treatmentselek- 
tion. Jedoch ist es mit keiner dieser nichtparametrischen Annahmen möglich, die 
Bildungsrendite zu identifizieren, lediglich das Intervall für die möglichen 
Punktschätzungen der Bildungsrendite wird mehr oder weniger stark verengt. In 
dem abschließenden Vergleich dieser nichtparametrischen Annahmen wird theo- 
retisch herausgearbeitet, dass die Identifikationskraft der Kombination der An- 
nahme monotoner Treatmentselektion und der Annahme monotoner Response- 
funktionen, die Annahme von MTS-MTR am größten ist. Der empirischen An- 
wendung bleibt es vorbehalten, das relative Ausmaß der Verbesserung der 
Grenzen für die Bildungsrenditen bei den verschiedenen Annahmen zu bewer- 
ten. Dabei stellt sich heraus, dass allein mit dieser MTS-MTR-Annahme Ober- 
grenzen für die Bildungsrendite geschätzt werden können, die durchweg inner- 
halb eines ökonomisch sinnvollen Rahmens bleiben. Auch im Vergleich mit der 
Annahme monotoner Instrumentalvariablen und monotoner Responsefunktio- 
nen, MIV-MTR, zeigt sich die MTS-MTR-Annahme überlegen. 


Wie bereits erwähnt wurde, führt die Verwendung von Dummyvariablen für 
Bildungsabschlüsse in der Regel zu großen Unterschieden in den jährlichen 
Renditen. Da die Unterschiede zwischen den Bildungsabschlüssen durch die 
Umrechnung in Bildungsjahre nicht gänzlich verloren gehen — siehe Tabelle 5.1 
—, ist es nur natürlich, dass die nichtparametrischen Obergrenzen der Bildungs- 
renditen und die ETS-Punktschätzungen in Abhängigkeit der verglichenen Bil- 
dungsjahre ähnlich stark differieren. Erstmals wird daher in der vorliegenden 
Arbeit die Angemessenheit einer einzigen, durch Standardverfahren geschätzten, 
Bildungsrendite zur Beurteilung der Lohnstruktur und deren Entwicklung aus 
einer neuen Blickrichtung stark in Zweifel gezogen. 


Neben der Anwendung nichtparametrischer Obergrenzen werden erstmalig für 
deutsche Daten zwei Fehlermodelle auf die Schätzung nichtparametrischer 
Grenzen für Erwartungswert und Quantile des Haushaltsnettoeinkommens an- 
gewendet. Anhand zweier Datensätze (SOEP und CPS) wird gezeigt, dass die 
prinzipielle Vorgehensweise einiger robuster Verfahren, sich bereits vor der 
Stichprobenrealisation gegen mögliche Ausreißer beispielsweise in Form ent- 
sprechender Verlustfunktionen zu schützen, in vielen Fällen zu konservativ ist. 
Diese Vorgehensweise lässt nämlich die Informationen über mögliche Ausreißer 
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unberücksichtigt, die durch die realisierte Stichprobe gewonnen werden können. 
So ergibt sich beispielsweise selbst bei Annahme von Korruption und einem 
Anteil an Antwortverweigerern von 4,3% ein Intervall für den Median von le- 
diglich 220 DM. Dies ist angesichts der Rundungsproblematik bei Einkom- 
mensbefragungen angenehm klein. Erstmals werden in der vorliegenden Arbeit 
auch Bootstrap-Konfidenzintervalle für diese nichtparametrisch bestimmten In- 
tervalle geschätzt. Diese bewegen sich bei den SOEP-Daten im einstelligen DM- 
Bereich. 


Darüber hinaus wurden im empirischen Teil der Arbeit erstmals Daten des So- 
zio-oekonomischen Panels bis zum Jahr 2000 zur Analyse der Bildungsrenditen 
verwendet. Gerade die Erweiterung des Beobachtungszeitraums um drei Jahre 
gegenüber den bisherigen Studien kann den sich dort berichteten Trend zu sin- 
kenden Renditen relativieren. Sowohl bei den Männern als auch bei den Frauen 
kehrten die Bildungsrenditen nach teilweise deutlichem Rückgang in den 90er 
Jahren bis zum Jahr 2000 wieder auf das Ausgangsniveau zurück, unabhängig 
davon, ob mit OLS- bzw. Medianregressionen oder mit nichtparametrischen 
Obergrenzen geschätzt. Es beleibt abzuwarten, ob dies eine Zunahme der Streu- 
ung der Bildungsrenditen oder eine Umkehrung des Trends bedeutet. Ebenfalls 
relativiert werden muss die These höherer Bildungsrenditen von Frauen. Diese 
Aussage trifft lediglich auf teilzeiterwerbstätige Frauen zu. Betrachtet man voll- 
zeiterwerbstätige Frauen, so liegen die Renditen der Männer sogar systematisch 
über denen der Frauen. Eindeutige Resultate erhält man auch bei der Kohorten- 
analyse. Schon die deskriptive Analyse der Entwicklung der Lohnstruktur bringt 
zu Tage, dass die Lohnstruktur der Frauen über alle Kohorten hinweg symmetri- 
scher und weniger gespreizt ist als die der Männer und sich daran auch im Zeit- 
ablauf nichts ändert. Die geringste Lohnspreizung ist dabei sowohl bei den 
Männer als auch bei den Frauen in der jüngsten Kohorte festzustellen. Dies 
spiegelt sich bei der Analyse der Bildungsrenditen darin wider, dass auch hier 
jeweils die jüngsten Kohorten die niedrigsten Werte aufweist. Dabei ist der 
Rückstand bei der jüngsten Kohorte der Frauen gegenüber den anderen Kohor- 
ten mit etwa vier bis knapp unter sechs Prozentpunkten noch drastischer als bei 
den Männern mit etwa zwei bis vier Prozentpunkten. Bestätigt werden kann in 
der vorliegenden Studie auch ein Ergebnis des PURE-Projekts für Deutschland, 
dass hier Instrumentenschätzungen mit der Bildung der Eltern als Instrument im 
Gegensatz zu mehreren internationalen Studien nur zu einer geringen Erhöhung 
der geschätzten Bildungsrenditen im Vergleich zu den entsprechenden OLS- 
Schätzungen führen. 
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Nicht bewährt hat sich in der abschließenden empirischen Evaluation die An- 
wendung nichtparametrisch geschätzter Obergrenzen für die Messung der Lohn- 
diskriminierung. Obwohl sich dies in der Theorie durchaus ansprechend dar- 
stellt, da Diskriminierung hier im Unterschied zu den traditionellen Zerlegungs- 
verfahren in Abhängigkeit des betrachteten Bildungsniveaus gemessen werden 
kann, zeigen die empirischen Ergebnisse, dass die nichtparametrischen Ober- 
grenzen zu schwankend sind, um Lohndiskriminierung signifikant messen zu 
können. 


Die Ergebnisse der vorliegenden Arbeit lassen gleichzeitig in mehrfacher Hin- 
sicht ergänzenden Forschungsbedarf erkennen. Die nichtparametrischen Verfah- 
ren sollten durch Bestimmung von MTS-MTR-Grenzen für Quantile erweitert 
werden. Die CMTR-Obergrenzen führen hierbei in der empirischen Anwendung 
wie bei der Bestimmung von Grenzen für den Erwartungswert nur zu unbefrie- 
digenden Ergebnissen. Noch größerer Forschungsbedarf besteht jedoch sicher- 
lich im empirischen Bereich hinsichtlich der stilisierten Fakten. Hier stellen sich 
dringliche Fragen wie beispielsweise die Frage nach den Ursachen der so nied- 
rigen Bildungsrenditen jüngerer Kohorten, insbesondere bei den Frauen. Diese 
Fragen können jedoch nur im Rahmen einer erweiterten Methodik untersucht 
werden. Dabei ist vor allem auch an detaillierte Schätzungen von Arbeitsnach- 
fragemodellen zu denken. 
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